【基于机器学习的餐馆评论文本分类分析】( 八 )


4.3 模型检验
经过上文对模型的训练 , 我们最终选择了表现效果更好的逻辑回归模型 , 为了验证和评估训练好的分类模型在真实场景下的表现 , 通过用户输入新的评论 , 我们可以将模型应用于没有包含在训练集和测试集中的数据 , 这样可以更全面地评估模型的泛化能力和真实世界中的应用效果 。
输入新评论 , 对新评论作同前文一致的文本预处理 , 进行特征提取和处理 , 使用训练好的分类模型进行预测 , 得到分类结果如下 。
新评论分类结果
我在上海尝试了一家新开的法式餐馆 , 感觉非常惊艳!从前菜到主菜再到甜品 , 每一道菜都很讲究 , 味道和口感都非常出色 , 让我直呼过瘾 。服务也非常周到 , 服务员们知道如何处理每一个细节 , 让整个用餐过程非常愉快 。虽然价格有点贵 , 但绝对值得一尝
好评
这家餐厅真是太失望了!除了位置好以外 , 其他都非常不行 。我们点了几道菜 , 但味道都太油腻了 , 而且肉的质量也很差 。虽然服务员很友好 , 但是等待时间太长了 , 甚至比正常情况下还要糟糕 。餐厅的氛围也不好 , 很吵 , 感觉不适合用餐 。总之 , 这是一次糟糕的体验 , 不会再来了
差评
从新评论在逻辑回归模型上训练的分类结果看 , 逻辑回归模型的预测结果准确 , 具有良好的拟合效果 。
5 总结
本次研究所使用的数据量较大 , 但在处理缺失值时 , 采取了删除空值的措施 , 这导致了数据量的大量损失 , 是本研究的不足之一 。为此 , 可以采用决策树预测等方法对评分的缺失值进行填充 , 以提高数据的覆盖面和模型的拟合效果 。
在计算综合评分时 , 权值是自定义的 , 可以采用网格搜索来确定权值 , 以实际分类模型的分类效果来确定最优权值 。
为了筛选水军数据 , 我们采用了方法来计算相似度 。未来 , 我们可以探索其他更有效的筛选方法 , 以提高数据的可靠性和准确性 。
在本次研究中 , 因为安装问题所以没有使用服务器 , 在未来的研究中 , 我们可以考虑使用来进行数据索引和检索 。这样可以更快速和准确地查询数据 , 并提高数据的处理效率和精度 。同时 , 还能够提供强大的搜索和分析能力 , 帮助我们更好地理解数据 , 发现数据中的规律和趋势 , 为研究提供更深入的支持和指导 。
6 参考文献
[1] 张东红,马一凡,刘丹.基于文本分类方法的新闻主题识别系统[J].信息技术与信息
化, 2021(10):163-165.
[2] Shen F, Luo X, Chen Y. Textforweb page based on deep[C],on. IET, 2013:451-456.
[3] 张紫琼. 在线中文评论情感分类问题研究[D].哈尔滨工业大学,2010.
[4] 丁照银. 基于机器学习的评论文本分析[D].安徽师范大学,2019.
[5] 王浩然. 基于机器学习的微博网约车话题评论文本分析[D].南开大学,2021.
【【基于机器学习的餐馆评论文本分类分析】】[6]郑明明. 基于机器学习的冰雪旅游评论文本分析[D].燕山大学,2022.