Cross-domain Sentiment Analysis
Доклад посвящен проблеме автоматического анализа эмоциональной окраски текста (sentiment analysis) на примере рецензий пользователей о продуктах, взятых с сайта Amazon.
Мы поговорим о методах адаптации машинных алгоритмов, обученных на корпусе рецензий об одном продукте, для классификации рецензий о другом продукте (cross-domain sentiment classification). Вначале мы представим линейную модель прогноза потери точности при cross-domain sentiment classification, базирующуюся на двух параметрах: сходстве продуктов (domain similarity) и сложности корпуса рецензий (domain complexity) для классификации эмоциональной окраски текста (sentiment classification). Во второй части доклада будет подробно рассказано об алгоритмах, основанных на графах (graph-based algorithms), и о результатах их применения к проблеме cross-domain sentiment classification.