摘要:据《中国互联网络发展状况统计报告》显示,截止到2022年12月,全国有10亿以上的用户,因特网普及率为74.4%。在互联网发展的大环境下,电商平台出现了数以万计的评论数据,对挖掘线上药品消费者的需求和提升电商药品的口碑具有重要价值。文章爬取了京东电商平台上某肠胃药品的评论数据,并基于预处理以后的文本数据进行了情感倾向性分析和LDA主题模型分析。结果表明,该肠胃药品具有价格偏贵、售后服务差、物流运输差、部分包装损坏等不足之处。根据所得结论对电商药品消费者提供一些决策性参考,同时也为医药商品线上销售的升级等提供一定的参考依据。
关键词:情感分析药品在线评论LDA主题模型
1引言
1.1研究背景
当今我国移动宽带用户普及率已达到98%。越来越多的消费者参与在电商交易中,人们在线上购物时经常参考商品评论对产品进行更多的了解,与此同时在购买后也会进行评价,发表自己的使用感受。Diana和Maria[1]提到,当人们看到别人的评论被许多人关注的时候,因为自己也想被关注的期望,就会促使他们去评论,这就意味着在线商品评论会持续地刺激更多的评论。当然,也有很多平台会以奖励积分等方式来激励用户做评论。而各参与方都有必要去挖掘大量的评论中所蕴含的信息。对于电商平台而言,能够根据文字数据,更好的调整产品的排版,以及产品的关键词的更新等;同时,厂商也会针对使用者的意见进行改善,让消费者更加满意;对消费者来说,尤其在购买药品上注重的更多,考虑得更细节。购买关乎健康的药品需要更多保障,所以在购买前以大量产品信息做参考,从而减少信息不对称有效的做出决策。可以利用机器学习模型从以往消费者留下的大量评论中分离出意见与认同,提取出潜在的意见和感受,进而总结得出一些结论,为消费者提供参考价值,也为商家提供改进意见。
1.2研究意义
为了快速了解消费者的使用感受,本文使用机器学习模型的分析途径来挖掘文本情感倾向信息,并且研究商品评论中的消费者感受和偏好,降低人工查阅的负担,对企业经营以及药品销售的改进提供支持。不带任何主观感情且只对真实情况进行阐述的评论能够明显地表达出产品的好坏,起到提升购买量的作用。在消费者市场中了解顾客非常关注的因素,这对促进医药企业线上的营销,提升消费者对线上购买药品满意度至关重要。
理论意义方面,本文运用支持向量机作为分类方法,对大量的文本进行了情感分析,利用LDA主题模型提取出现频率最高的几个产品特征词以及差评中相关联的产品特征,从而总结出商品的改进之处。不仅验证了机器学习模型在药品评论情感分析中的实用性,也为药品营销和产品宣传做升级等提供一些参考。
现实意义方面,电商平台依据顾客的意见重新调整旗下平台产品的投放资源,也可以对网页的板块分布进行更新。对厂商来说,本文提取的差评关键词为他们提供参考,了解该肠胃品牌的声誉情况以及消费者的使用感受,及时进行改进和升级。对电商平台的消费者来说,本文帮助他们更快了解有效的产品信息,包括产品的优势以及缺陷,消费者结合产品信息再决定是否购买,避免了物流、包装破损等问题造成的损失。
如此,可以让平台、企业以及用户之间相互了解,不仅可以大程度的降低企业在各方面的成本,同时也可以增加顾客对于企业以及平台的满意度,也可以在一定程度上降低客户对于产品的投诉,打造出一个好的产品形象,形成良好的品牌效应。所以,本文的研究具有重要的意义。
1.3国内外文献综述
1.3.1情感分析的应用
情感词典、支持向量机模型、LDA模型等在情感分析中的应用比较常见。例如,唐晓波[2]等人提出了特征本体论的商品评论情感分析方法,通过建立领域情感字典、微博表情符号字典,并对其进行了量化,并对其进行了实证研究。肖璐[3]等人针对现有研究中存在的问题,提出了一种以用户评价作为数据来源的企业产品层面的竞争者识别方法,并在此基础上,构建了一种基于情绪分析技术的特征情绪加权算法,并通过此算法对企业的产品特性进行了优劣分析,从而获得了一个有利和不利的特征集,从而实现了对企业产品层面竞争者的识别和分析。刘鲁川[4]等人探讨了微博用户的情感体验和用户满意度的关系,并运用了心理学中的情绪测量方法,对微博用户在使用时的情绪体验进行了分析,并进行了回归分析,对此进行了验证,这对于全面了解微博用户的行为规律有着重要的理论意义。聂卉[5]利用深度文本分析技术,抽取特征指数,并综合运用计量经济学、机器学习等手段,对指数的科学性进行验证。研究表明,基于评论内容可以有效地检测评论的质量,识别出高质量的评论,从而提升其实用性。史伟[6]等人对特征、情感类别、强度、程度、否定、修辞、标点符号等语义要素进行了标记,从“句法”到“文本”的层次上建立了一套情感度量方法,并对其进行了深入的分析,发现了在不同的评论语料库中,情感的表现形态和相互联系在一起的现象。徐健[7]提出了一种以情绪分析为基础的预测方法,并对该方法的逻辑基础、常用的预测方法、关键技术进行了分析,并对其目前面临的问题及未来的发展方向进行了探讨。
Deepa R.等[8]提出了使用多项式朴素贝叶斯和逻辑回归对餐厅评论数据集进行情感分析,这个程序帮助所有者迅速确定客户的情绪去了解客户,有助于他们更成功地发展业务。Sufi Fahim等[9]利用人工智能(AI)和自然语言处理(NLP)的现代技术进步来理解与网络攻击和电子战相关的社交媒体帖子的上下文信息,在75天中,基于人工智能的语言检测、翻译和情感分析在47种不同语言的中解析15983条推特,最终为中国、澳大利亚、俄罗斯、乌克兰、伊朗和印度生成了75个异常的每日网络威胁指数,利用这些情报,战略决策者可以调整他们的网络准备,以减轻网络罪犯所遭受的有害损害。Stellacci Stefania等[10]研究对意大利热门目的地周边——历史广场和火车站的在线评论进行情感分析,旨在为城市设计分析中的社区参与提供新的视角,这种先进的分析重塑了人们解读更广泛社区的思想和情感的方式,从而将这些纳入以地方为中心的发展战略。
1.3.2支持向量机模型的应用
支持向量机是一种有坚实理论基础的新颖的小样本学习方法。支持向量机模型可做倾向化分析,刘祉燊等[11]应用支持向量机对学院的官方微博评论进行了情感分析,调整优化参数后取得了更好的分析结果。邓君[12]将微博上的话题评论作为数据来源,对其进行了正向和负向的情绪评价,并对其进行了正向和负向的评价,验证了该方法能够对网友的情绪趋势进行有效的预测。朱文峰[13]通过对经典的文字抽取方法及指派摄像机的数据分析,证明了基于Fourier混合核的SVM模型在提高文字分类精度的同时,也大大提升了训练的效率。许艳秋等人[14]运用AHP方法,对各指标的权重进行了计算,并对数据进行了处理,最后用SVM方法对数据进行了分类,从而验证了AHP方法在数据预处理中的应用可以极大地改善个人资信评价的精度。李婷婷等[15]提出了一种支持向量机与条件相关F相结合的情绪分析新方法,选择了不同的特征,经过多次试验,得到了最佳的情绪分析结果,其中支持向量机模型的准确率为88.72%。杨经等[16]对中文文本词语和句子的情绪分析进行了研究,分析了词语的特点,并进一步挖掘了隐含的情绪词语,最终采用SVM分类算法实现了句子的情绪识别和归类。经试验验证,该方法具有一定的合理性和有效性。
Chandralekha E.等[17]对有关国家资格和入学考试(NEET)的文本数据进行情感分析.进行分类.并确定人们对NEET的感觉。在这项研究中.11种不同的机器学习分类器被用来分析微博情绪,以及自然语言处理(NLP),帮助XX和组织在这种文本数据调查的帮助下更迅速地对令人震惊的问题采取行动。Oladele Temidayo Michael等[18]从Twitter上收集了带有#EndSARS的用户推文,并对其进行预处理,将其标注为正类和负类,然后使用支持向量分类器对其中表达的情感进行分类;实验结果表明,在测试集上,准确率为90%,精确率为94%,召回率为85%,F1分数为89%,在社交媒体上挖掘这样的舆情可以通过作为预警系统来辅助XX和其他关注组织。Jassim Mustafa Abdalrassual等[19]比较了简单和集成ML方法作为SA的分类器:随机森林、K近邻、Light GBM、随机梯度下降和Bagging等等。使用一个50,000次电影评论的测试集数据库,选择了20000个对文件的感觉有影响的词语,从大规模和序列试验中获得的词频特征和词频-逆文档频率,比较使用特征提取技术的各种分类器获得的结果。为了评估和量化我们所考虑的不同ML方法的性能使用了6个标准度量:精确率、准确率、召回率、f值、AUC和Kappa-measure,结果表明支持向量机模型(SVM)分类器是最好的,其准确率为88.333%,其次是FDOSM方法,在相同的测量中,它的准确率为0.800.用于药品线上评论的情感分析研究较少,本文尝试将准确率较高的机器学习模型SVM用于医药电商评论的挖掘,提取消费者潜在的情绪和意见。
1.3.3 LDA模型的应用
LDA模型是自然语言处理领域中最重要的技术之一,冯坤[20]等人利用LDA模型,从消费者对生鲜电商的评价中,抽取消费者对消费者的评价指标,建立消费者的情感字典,并计算消费者对消费者的情感倾向性评分,最后,以天猫平台上各类生鲜产品的消费者评价为例,对所提方法进行实证研究,以检验本项目所提方法的可行性与有效性。陈晓美[21]以民间舆情数据为切入点,运用文本挖掘、LDA主题模型等理论与方法,基于主题聚类的视角,对网络评论信息分析模式、观点挖掘的理论、技术、方法及其应用进行了深入而系统的研究。张冬梅[22]提出一种基于非均衡数据和融合学习的新型情感分类方法,解决了多文档观点摘要和情感分类中的两大问题。李方涛[23]以商品评论为实例,探讨情感分析中的分类、检索、抽取以及情感数据的可信度等问题。
1.4研究目标与研究内容
随着医药电商行业的不断发展,线上平台累计了海量的药品评论数据。这些药品评论内容虽然看起来杂乱,却隐含了消费者对线上购买药品的感受与情绪,蕴藏着巨大的潜在价值。本文将针对京东电商平台上的某肠胃药品评论数据,尝试将已有的机器学习技术(支持向量机模型)应用于线上评论文本中,验证机器学习模型对药品评论情感分析的实用性。不仅丰富情感分析在健康医疗领域中药品评论方面的研宄,也为消费者提供便利,节约了解产品浏览大量评论的时间。最后,通过LDA主题模型在处理好的数据文本中提炼出消费者真实的态度和意见,帮助生产企业更加深入了解用户的真实需求与情感评价。
2文本挖掘与分析
2.1文本挖掘
文本挖掘是指利用计算机从大量的文本数据中统计提炼出文本隐含的信息或特征的过程。对原始爬取得到的文本不能直观看到其主要特征,因此需要进行文本挖掘。本文从京东商城爬取了电商评论数据,直接爬取的数据都是非结构化的,需要经过一系列处理转为结构化数据再进行进一步研究。
本文选取的线上商品为肠胃药品,数据来源于京东商城某品牌肠胃药自营旗舰店评论,此类型药品评论数据非常多,相较于其他的产品其评论内容趋于更加多样化,消费者所关注的产品特征更多。由于京东商城商品在线评论文本使用python代码爬取受到限制,所以本文直接通过第三方采集器八爪鱼进行采集。原始数据共爬取正面评价1000条、负面评价1000条。爬取到的部分评论数据见图1:
2.2文本预处理
2.2.1数据清洗
从爬取到的部分数据可以看出,评论中会出现重复的评论,原因可能是消费者对自己多次购买的商品给出了同样的评价,也有为了获得京东积分而复制多次评价内容。重复的评价在文本处理时应当及时去除,否则统计词频和后续使用LDA模型获取产品关键词时会造成误差。另外,评价文本中大量的出现重复的词语,例如“很好很好很好”,“还不错不错不错”等,应当采用压缩去词的方法进行清洗,如图展示的是部分评论压缩去词成果。爬取到的评论数据经过简单的去重处理之后,可以得到比较干净的文本。
2.2.2文本分词
预处理首先要对文本进行分词。Python中的jieba库词汇量非常丰富,本文对商品评论数据基于中文分词处理时使用结巴分词中的精确模式,分词时直接加载了结巴分词包进行操作。本文数据是商品评论数据,不具有特别的新词,因此直接采用默认的分词词典进行操作。
调用Python的jieba分词包中对应的函数可以同时获得分词结果和对应的词性标注。标注词性后可以去掉指定词性的词,例如叹词,时间词,非语素词等。经过分词处理和词性标注的部分评论结果见图2和图3:
2.2.3词性标注和去停用词
根据jieba分词得到数据结果中,需要去除没有实际意义的词,例如“就是”、“已经”、“时候”、“可以”等。这些词不仅浪费文本空间,且对文本挖掘没有帮助,所以将其加入到停用词表中,起到提高后期文本分类的效果。再对词语添加名词等标签。本文基于全部的分词在标注词性之后再去停用词。本文所用的停用词表是哈工大停用词表(746个词),此外,由于本文数据是京东电商产品评论数据,文本中会出现很多“京东”等词,这样的词也需要添加在停用词表中,最终停用词表共包含751个词,然后遍历分词结果,如果停用词在文本中,将其删去,对比见图4和图5。
2.2.4词频统计
对肠胃药品评论预处理后的文本数据做词频统计,评论文本中出现频次最高的前12个关键词,见图6和图7:
2.2.5词云图
可以使用词云图分析了解出现在负面评价中的高频词,初步分析产品特征,见图8。但要进一步的分析消费者对某一具体特征做出的评价,或判断某个高频词属于哪个主题时,词云图无法明确。例如“不错”这个词,仅从词云图无法判断是在说药品质量还是在说物流感受,但人们认为“不错”应当大概率会出现在药品质量的主题下,运用LDA主题模型可以从概率的角度给出这一判断的依据。
3倾向化分析
3.1基于机器学习的方法
3.1.1支持向量机模型
文本情感分析的步骤为对预处理后的词采用基于统计的方法对词对所在的逐条文本进行分类,文本情感基本可以分为积极和消极两类。支持向量机(Support Vector Machine,SVM)是人工监督下的一个二元分类器,其思想是找到最佳的直线或平面,将数据分为两类,在特征空间上由于支持向量机是间隔最大的线性分类器,找到的最优直线或平面使分类结果呈现最鲁棒状态,所以SVM的学习策略为求分类间隔最大化。
3.1.2情感分析结果
支持向量机模型的步骤:
1.采用分类算法和训练集。通过训练数据集,得到一个分类器;
2.用经过训练的分类器对验证集进行分类,并得到分类结果
3.将由该分类算法得到的结果与和人工标注的结果进行比较,从而得到该分类算法的精度。
我们将预处理后的文本数据作为情感分析的原始数据,先将其分为两个部分,一部分作为训练集,一部分作为测试集。其中,我们选取了35%的数据作为训练集,其余的作为测试集。
SVM的分类性能与其核函数、惩罚因子的选取密切相关,因此选取适当的参数是SVM分类性能的关键。首先默认惩罚系数为1,然后选取三种常见的核函数,即线性核函数,多项式核函数,以及径向基核函数进行测试。在不同核函数下的分类准确率见表1。
由表1结果可知,当核函数选择多项式核函数时,分类效果最好,可达到91.0%,远高于其他2种核函数下的准确率。所以,选择多项式核函数作为中文文本情感分类预测模型的核函数。除了核函数影响分类结果准确率之外,惩罚因子与分类结果密切相关。在选择多项式核函数的前提下,测试不同惩罚因子对分类结果的影响,见表2。
由表2的分类准确率可知,惩罚因子为0.8时,多项式核函数的分类效果较好,分类准确率达到95.2%。因为评论数据的数量基数较小,而且数据源仅仅是一种品牌的肠胃药品,数据特征缺乏广泛性和代表性。所以,该模型得到的测试结果会受到一定的限制。
基于使用机器学习模型做测试评论数量不会变化,爬取的评论文本做初步处理后,测试集分类得到积极情感文本337条和消极情感文本363条,共700条。
4 LDA主题模型
4.1 LDA模型步骤及原理
4.1.1 LDA模型原理
LDA是一种最常用的主题模型,也称隐含狄利克雷分布。模型中主题以一定的概率选择了文档,二者之间对应一个概率分布;同理其关键词也以一定的概率选择某个主题,他们二者之间也应当对应概率分布。将文本语言材料进行特征提取后,先将带有潜在主题信息的词汇提取出来,然后再经过对特征词汇的不同维度进行分析对比,最后再筛选出符合标准的词汇建立特征词库。
4.1.2寻优图
本文使用LDA模型去找出更多的主题,但是要注意寻找的过程要符合一定的规则,其次是寻找主题时,我们尽量选择那些重复出现的主题。在一份文本中,我们不确定某个词是属于某个主题的。主题的个数越多时模型的困惑度越低,然而,当主题数量较多的时候,生成的模型往往会出现过拟合。因此不能仅凭困惑程度来判断问题的好坏。我们首先可以知道一个题目的大概数量,然后利用困惑度从这个范围中挑选出更适合的题目。这种方式的好处是直观,可以很容易的看到这个词隶属于哪个话题,也可以判断这个话题是否正确。困惑值见图9和图10。
我们发现好评的perplexity值从1持续下降,所以主题数越小越好。而差评数据的主题个数超过8时,模型的困惑度就会一直下降,所以我们在2-7的主题个数中考虑差评的主题数。
再由计算输出的coherence值折线图可得,差评数据文本选取主题数为4进行可视化,好评数据文本选取主题数为1进行可视化。
4.1.3 LDA可视化
LDA主题模型经过计算可以获得某一词汇在某个主题中的概率分布,并将某个特定词划分到其概率最大的主题下,从而可以实现“不错”以最大概率属于哪个主题的划分。同时,还可以求得该主题下其他的关键词,输出的关键词的数目来自设定,一般每个主题取贡献度最大的前10个词作为该主题下的主题词。相对于其他主题模型,LDA主题模型的先验分布是狄利克雷分布,模型的泛化能力更强,不易出现过拟合现象。
由可视化可得,好评中的主题特征词主要是:“好、不错、肠胃、价格、快递”等,主要反映了该品牌药品治疗肠胃效果好,价格不错,物流速度很快;差评中的高频特征词主要是:“客服、快递、发货、收到、垃圾”等,主要反映了该品牌电商药品客户服务水平不高,物流不发货等问题。
5结论与建议
5.1结论
5.1.1模型总结
为了证明机器学习模型对药品评论情感分析的实用性,本文经过测试印证了支持向量机模型也适用于医药电商评论的情感分析,准确率可达到95%。通过模型分析,能够获得积极和消极情感的文字内容,从而对消费者的心理变化进行有针对性的分析,有助于电商平台了解客户需求,挖掘潜在的问题并进行改进。
5.1.1好评总结
通过对消费者情感倾向的分析后,探讨商品的优势和劣势。使用LDA主题模型可以挖掘出消费者在线上购买药品过程中所关注的主要内容。研究结果发现消费者关注内容聚焦在价格、物流、药品效果等方面,根据LDA主题词模型方法,可得好评的主题内容是:线上销售的药品价格比线下药店要低很多,效果也同样好。
5.1.2差评总结
根据LDA模型对差评的可视化结果可得,差评数据的主题内容是物流速度、客户服务质量、价格变化等方面的问题。这些大大影响了消费者对于电商医药的态度。其次,商品的外包装及保证货真价实也是商品质量的一个重要方面。如果出现了外包装破损、药物被挤压等情况,都会对药物的品质和效果产生影响,特别是可能对我们的身体健康造成影响,因此,也应该对药物的包装和质量给予更多的关注。
5.2对医药电商零售商的建议
(1)提升物流效率和客户服务。物流时间过长一直是网络购物的一大诟病,物流时间太长大大降低了消费者的购物体验,甚至直接导致差评,除了提升发货仓效率,缩短发货时间,当消费者反映物流问题时,客服的服务态度和方式将直接决定差评是否可以挽回。因此客户服务无论在售前,售中还是售后都显得尤其重要,服务应当永远走在销售产品之前。
(2)改进商品的外包装。对电商销售来说,消费者接触不到卖家,也接触不到自己将买到的商品,在这种情形下,拿到包裹以及打开包裹的体验将决定了消费者对该商品的第一印象,在缺乏面对面交流和不太了解产品的情况下发生的电商购买,消费者将对商品外包装和购物体验要求将更加苛刻,根据LDA的分析结果可以看出,差评的一大原因就是商品外包装不让消费者满意。
(3)注重商品防伪和质量监测。由于药品是易潮品,消费者可能在短时间内一次购买多量同一商品,也可能在线下商场也购买过同一商品,如果消费者收到的产品有差异,也会导致差评的出现,此时商家应当在商品外包装上印上商品防伪码,并且以可能的方式告知消费者收到的商品会与旧版本有何差距,消除消费者上当受骗的感受,另外,应当加强质检,避免出现商品质量问题,从而让消费者认为买到了假货。
(4)控制价格变化幅度。商品价格变化过快也是导致差评的原因之一,消费者买前和买后的价格差价过高难免会引起消费者的不满。商家在利用降价来吸引新顾客的同时,也要照顾到老顾客的购买感受,可以采取适当的营销方式,例如给老顾客送优惠券,或者返差价的方法提升顾客满意度。
5.3对医药购买者的建议
从评论特征的分析结果看,此类药品的差评主要来自于外部原因,例如物流,服务和包装等。从商品自身的品控来看,该品牌药品的确是一个不错的选择,但在物流、服务等方面不足,消费者在决定是否购买该款产品时可以根据自身最关心的因素来确定,如果看重商品的物流、发货速度等,可以选择去线下购买或者提前与客服协商物流问题,预留好快递等待的时间。
总而言之,该品牌药品有许多不足之处。对生产商而言,应当继续加强产品品牌和质量控制并逐渐开发出更好的功能,带给消费者更多更好的体验;对销售商而言,应当更加注意与消费者的沟通和以及加强产品运输和价格控制,同时做好售后工作争取减少差评,对消费者而言,也要根据自身的理性判断和实际需求来决定是否购买。
5.4局限性
本文对词典的构建依然比较粗糙,未来可对词典的构建展开深入研宄。此外,虽然通过机器学习能够得到了模型,但是近几年深度学习发展迅速,在以后的研宄中可考虑利用深度学习相关知识进行构建模型。其次,本文测试所使用的数据集仅为爬虫获取的京东平台某品牌肠胃药品的部分评论,仍然存在很多评论文本未在实验中验证。
参考文献:
[1]Diana Gavilan,Maria Avello,Gema Martinez-Navarro.The influence of online ratings and reviewson hotel booking consideration[J].Tourism Management,2018,66.
[2]唐晓波,兰玉婷.基于特征本体的微博产品评论情感分析[J].图书情报工作,2016,60(16):121-127+136.DOI:10.13266/j.issn.0252-3116.2016.16.015.
[3]肖璐,陈果,刘继云.基于情感分析的企业产品级竞争对手识别研究——以用户评论为数据源[J].图书情报工作,2016,60(01):83-90+97.DOI:10.13266/j.issn.0252-3116.2016.01.012.
[4]刘鲁川,孙凯.社会化媒体用户的情感体验与满意度关系——以微博为例[J].中国图书馆学报,2015,41(01):76-91.DOI:10.13530/j.cnki.jlis.151007.
[5]聂卉.基于内容分析的用户评论质量的评价与预测[J].图书情报工作,2014,58(13):83-89.DOI:10.13266/j.issn.0252-3116.2014.13.014.
[6]史伟,王洪伟,何绍义.基于语义的中文在线评论情感分析[J].情报学报,2013,32(08):860-867.
[7]徐健.基于网络用户情感分析的预测方法研究[J].中国图书馆学报,2013,39(03):96-107.DOI:10.13530/j.cnki.jlis.2013.03.024.
[8]Deepa R.,Khan Fardeen,Singh Harsh,Gupta Gundu Jitendra Satya Sai.Sentiment Analysis on Food-Reviews Dataset[J].Advances in Science and Technology,2023,6630.
[9]Sufi Fahim.A New Social Media-Driven Cyber Threat Intelligence[J].Electronics,2023,12(5).
[10]Stellacci Stefania,Moro Sérgio.Travellers’perspectives on historic squares and railway stations in Italian heritage cities revealed through sentiment analysis[J].Journal of Urban Design,2023,28(2).
[11]刘祉燊,张倩,周菠,汪志霖,顾永昊.基于支持向量机的中文文本情感分析方法研究[J].科技创新与应用,2022,12(32):27-30.DOI:10.19981/j.CN23-1581/G3.2022.32.007.
[12]邓君,孙绍丹,王阮,宋先智,李贺.基于Word2Vec和SVM的微博舆情情感演化分析[J].情报理论与实践,2020,43(08):112-119.DOI:10.16353/j.cnki.1000-7490.2020.08.017.
[13]朱文峰.基于支持向量机与神经网络的文本分类算法研究[D].南京邮电大学,2019.DOI:10.27251/d.cnki.gnjdc.2019.000523.
[14]许艳秋,潘美芹.层次分析法和支持向量机在个人信用评估中的应用[J].中国管理科学,2016,24(S1):106-112.
[15]李婷婷,姬东鸿.基于SVM和CRF多特征组合的微博情感分析[J].计算机应用研究,2015,32(04):978-981.
[16]杨经,林世平.基于SVM的文本词句情感分析[J].计算机应用与软件,2011,28(09):225-228.
[17]Chandralekha E.,Jemin V.M.,Rama P.,Prabakaran K..Sentiment Analysis of National Eligibility-Cum Entrance Test on Twitter Data Using Machine Learning Techniques[J].Advances in Science and Technology,2023,6630.
[18]Oladele Temidayo Michael,Ayetiran Eniafe Festus.Social Unrest Prediction Through Sentiment Analysis on Twitter Using Support Vector Machine:Experimental Study on Nigeria’s#EndSARS[J].Open Information Science,2023,7(1).
[19]Jassim Mustafa Abdalrassual,Abd Dhafar Hamed,Omri Mohamed Nazih.Machine learning-based new approach to films review[J].Social Network Analysis and Mining,2023,13(1).
[20]冯坤,杨强,常馨怡,李延来.基于在线评论和随机占优准则的生鲜电商顾客满意度测评[J].中国管理科学,2021,29(02):205-216.DOI:10.16381/j.cnki.issn1003-207x.2019.2108.
[21]陈晓美.网络评论观点知识发现研究[D].吉林大学,2014.
[22]张冬梅.文本情感分类及观点摘要关键问题研究[D].山东大学,2012.
[23]李方涛.基于产品评论的情感分析研究[D].清华大学,2011.
1、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“文章版权申述”(推荐),也可以打举报电话:18735597641(电话支持时间:9:00-18:30)。
2、网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
3、本站所有内容均由合作方或网友投稿,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务。
原创文章,作者:1158,如若转载,请注明出处:https://www.447766.cn/chachong/203906.html,