FIEK360系列|運用文本大數據分析手法,從大量文本資料呈現關注主題與趨勢要點
IEK360|Applying Text Big Data Analytics for Manifesting Main Topics from Massive Text Content
- 2020/02/20
- 5574
- 432
簡報大綱
針對工研院產科國際所各樣的研究議題,產業分析師會透過閱讀相關的文本資料,並將這些資料進行分類與歸納,進而對研究議題進行深度的解讀。然而以人力閱讀大量文本資料,然後再進行分類與歸納,對產業分析師而言是非常辛苦、耗費時間和精力的工作。
為要減輕產業分析師的痛點,透過FY108光點創新研究計畫的支持,研究團隊建立了工研院產科國際所自主開發的文本大數據分析手法。本研究運用文本詞袋向量計算、文本餘弦相似度計算、網絡集群分析、文字雲等工具串聯,可以快速並客觀地呈現文本資料的關注主題與趨勢要點,幫助產業分析師減少集群與分類苦工,並可將時間和精力多投入在研究議題的深度解讀,此類較有價值的工作。