基于弹幕文本挖掘的视频推荐应用研究任务书
[关键词:弹幕文本,文本挖掘,视频推荐] [热度 ]1、毕业论文开始前根据研究内容查阅相关参考文献,了解研究基本思路。
(1)整理文献,了解在线视频弹幕情况以及各类弹幕所代表的含义,并了解各种计算弹幕情感值的算法,将相关研究成果进行分类汇总形成文献综述;
(2)根据已有研究并结合自己的研究,试分析如何将弹幕情感值和推荐视频算法结合起来;
(3)了解如何爬取B站弹幕文本数据,需要用到哪些知识;
2.数据分析具体要求
(1)需要用到Python来爬取B站数据,并将数据进行预处理,过滤无关内容与信息;
(2)需要构建情感词典将弹幕分成正向中立以及负向三大类,通过情感词典与语义规则计算弹幕的情感值
(3)使用用户聚类算法,用户情感特征矩阵作为输入,对用户进行聚类,即可获得相同情感的用户,为后续进行视频推荐提供铺垫。
3.论文撰写要求
论文的撰写需要注意语句的通顺、格式的规范性,同时,整个论文的逻辑要清晰,从提出假设到数据分析要有对应关系,不可前面描述的是一个问题,后面实际进行的数据分析又是针对另一个问题。在提出方法的时候都要有数据以及理论依据的支持。
4.完成论文撰写。
5.根据研究内容,查阅以下参考文献
[1]何炎祥,孙松涛,牛菲菲,李飞.用于微博情感分析的一种情感语义增强的深度学习模型[J].计算机学报, 2017, 40(4):773-790.
[2]中国互联网信息中心.第46次中国互联网络发展状况统计报告[EB/OL]..http://www.cac.gov.cn/2020-09/29/c_1602939918747816.htm.
[3]靳晓莹. 弹幕视频网站对青年亚文化的建构研究[D].山西大学,2016.
[4]朱思淼,魏世伟,魏思恒,余敦辉.基于弹幕情感分析和主题模型的视频推荐算法[J/OL].计算机应用.1-9[2021-09-22].
[5]郑飏飏,徐健,肖卓.情感分析及可视化方法在网络视频弹幕数据分析中的应用[J].现代图书情报技术,2015(11):82-90.
[6]庄须强.基于深度学习的弹幕评论情感分析研究[D].山东师范大学,2018.
[7]宣一鸣.基于人物角色的视频弹幕多维度分析系统设计与实现[D.]北京邮电大学,2019.
[8]王雪瑞,刘渊.面向国内直播行业的分布式弹幕爬虫研究[J].计算机应用与软件,2018.35(2):134-140.
[9]邱宁佳,丛琳,周思丞,etal.结合改进主动学习的SVD-CNN弹幕文本分类算法[J].计算机应用,2019,39(03):28-34.
[10]张超.基于视频弹幕评论的自动摘要生成问题的研究[D].中国科学技术大学,2017.
[11]Fu X, Liu w, Xu Y, Cui L. Combine How Net Lexicon to Train Phrase Recursive Autoencoder for Sentence-Level Sentiment Analysis[J]. Neurocomputing.2017,241:18-27.
[12]肖红,许少华.基于句法分析和情感词典的网络舆情倾向性分析研究[J].小型微型计算机系统,2014,35(4):811-813.
[13]Peng H, Cambria E, Hussain A. A Review of Sentiment Analysis Research in Chinese Language[J]. Cognitive Computation, 2017,9:423-435.
[14]Liu Y, Bi J W, Fan Z P. Ranking products through online reviews: A method based on sentiment analysis technique and intuitionistic fuzzy set theory[J]. Information Fusion,2017,36:149-161.
[15]Poria S, Chaturvedi I, Cambria E, Hussain A. Convolutional MKL Based Multimodal Emotion Recognition and Sentiment Analysis[C]// IEEE 16th International Conference on Data Mining (ICDM). IEEE, 2017:439-448.