■作为顾客意见分析方法的一种,关注度上升
文本挖掘是分析像文章这样的定性数据的技术。因为能对定量数据分析无法彻底把握的顾客意见进行有效梳理而受到关注,如第六章中所介绍的对话分析和录音分析在
呼叫中心已开始得到活用。在实际分析中,首先要制作性别、年龄、地域等属性和数值的数据,然后再结合进行定性数据的文本挖掘,从而得到高利用价值的知识。
■支持文本挖掘基础的技术:形态要素解析
形态要素解析是将文章分解的技术。将文中出现的有意义的最小单位称作形态要素,以此解析句子,标注词性,进行处理。例如今天天气好这句句子,就可以分解为今天/天气/好。具体来说,需要进行以下三个方面的处理:
①语汇单元化(tokenization)
将句子进行以单词为单位的划分。
②还原活用语(Stemming,Lemmatization)
对英语的动词和名词的词尾,日语的活用语词尾等进行还原性处理。
③标注词性(Pait-of-speechtagging)
对每个单词进行词性标注的处理形态要素解析工具中,奈良尖端科学技术研究院大学的圆筒竹刷非常著名。
■文本挖掘工具
使用市场上销售的文本挖掘工具可以迅速分析出大量数据。在transcosmos,使用的是野村综合研究所的文本挖掘工具TRUETELLER"。"TRUETELLER被评价为具有多种机能,且用户操作起来很方便。具体分析功能请参考下表。