王礼敏,严倩,李寿山,周国栋.基于双通道LSTM模型的用户性别分类方法研究[J].计算机科学,2018,45(2):121-124
基于双通道LSTM模型的用户性别分类方法研究
User Gender Classification with Dual-channel LSTM
投稿时间:2017-05-18  修订日期:2017-06-26
DOI:10.11896/j.issn.1002-137X.2018.02.021
中文关键词:  性别分类,新浪微博,双通道LSTM
英文关键词:Gender classification,Sina weibo,Dual-channel LSTM
基金项目:本文受国家自然科学基金(61672366)资助
作者单位E-mail
王礼敏 苏州大学计算机科学与技术学院 江苏 苏州215006 lmwang@stu.suda.edu.cn 
严倩 苏州大学计算机科学与技术学院 江苏 苏州215006  
李寿山 苏州大学计算机科学与技术学院 江苏 苏州215006 lishoushan@suda.edu.cn 
周国栋 苏州大学计算机科学与技术学院 江苏 苏州215006  
摘要点击次数: 457
全文下载次数: 465
中文摘要:
      微博用户性别分类旨在根据用户信息进行用户性别的识别。目前性别分类的相关研究主要针对单一类型的特征(文本特征或者社交特征)进行性别分类。与以往研究不同,文中提出了一种双通道LSTM(Long-Short Term Memory)模型,以充分结合文本特征(用户发表的微博文本)和社交特征(用户关注者的信息)进行用户性别分类方法的研究。首先,利用单通道LSTM模型分别学习两组文本特征,得到两种特征表示;然后,在神经网络中加入Merge层, 结合两种特征表示进行集成学习,以充分学习文本特征和社交特征之间的联系。实验结果表明,相对于传统的分类算法,双通道LSTM模型分类算法能够获得更好的用户性别分类效果。
英文摘要:
      User gender classification aims at classifying the users into male and female with the provided information.Previous studies on gender classification mainly focus on a single type of features (i.e.,textual features or social features).Different from previous research,this paper proposed a new approach named dual-channel LSTM by making full use of the relationship between textual features (the text which user publishes) and social features (the followers which user concerns).Specifically,this paper first got two kinds of features using single-channel LSTM respectively.Then,it proposed a joint learning method to integrate the features.Lastly,it got the final classification results by the dual-channel LSTM.Empirical studies show that the dual-channel LSTM model achieves effective results for gender classification compared with traditional classification algorithms.
查看全文  查看/发表评论  下载PDF阅读器