2016/08/31「大數據,大解密」 研究調查新利器,深度語意分析

<span style=" display: block; font-size: 0.8em; font-weight: 100; color: #A5A3A3;">2016/08/31</span>「大數據,大解密」 研究調查新利器,深度語意分析

 

現代人因為網路和社群的普及,習慣將生活的酸甜苦辣分享在網路上,無形中留下個人的喜好、對商品事件的看法等,基於深度學習與科技的不斷演進,現今的電腦已可處理、分析龐大的輿情文字,甚至進而判斷網友所寫之文字的情緒,令「Social Listening 社群大數據研究法」 漸漸成為顯學。

有鑒於國人對社群大數據研究法求知若渴,國內最大的社群口碑分析品牌─《OpView社群口碑資料庫》於近日(8/29)舉辦「社群大數據分析應用發表會」,邀請了不同領域的專家學者,分享國內外最新社群大數據應用案例。

上半場首先由台大商研所楊立偉教授介紹社群大數據的發展脈絡,並帶來最新的技術應用案例;接著由政治大學公共行政學系蕭乃沂教授,以自身經驗,與大家分享在公共議題之中,如何利用社群資料了解民眾意見,以及如何檢視資料與分析的品質,最後再由益普索市場研究的兩位資深研究員,以生動的案例仔細地與大家解說分析社群數據的步驟。

 

研究調查新利器 – 深度語意分析

過去學術單位在處理文本時,必須雇請大量的人力進行標記,但在大數據時代下,傳統的分析方式早已無法應付如此龐大巨量的數據與深度分析的需求。

資料處理的技術不斷革新,現在藉由機器深度學習,模型經大量訓練後,將可自動標記出每篇文章的重要字詞,包含人、事、時、地、物等等,而這些經處理後的文本最大優點就是能進一步分析該發文者的輪廓。

在網路上,帳號是虛擬的,我們無從得知該帳號擁有者的個人資訊,但受Facebook與Google的啟發,前述網站藉由使用者”行為”,諸如點選文章、瀏覽網站等,進而反推出該使用者的樣貌與喜好;楊教授說到,社群文本則是藉由”內容”反推出人群樣貌。

PR_160901_01

舉例來說,當有人發文問選購事宜時,機器即自動為該文章判別出重要字詞來,接著為此發文帳號標記行為、喜好、個人資訊等標籤;當處理的文本越多,所掌握的被標記帳號越豐富。楊教授說到,過往OpView平台,蒐集全台灣輿情文本,以過濾”內容”的方式進行分析,然而憑藉上述技術,則可更進一步利用過濾”帳號”的方式,亦即採用Panel式的觀察法,當要進行市場行銷時,先挑選出目標受眾(帳號),觀察其行為與需求,再制定精準的銷售與行銷策略。

 

Panel 式特定族群觀察:  保險業為例

以保險業者為例,可先從數百萬的帳號中挑選出曾發表保險文章的帳號,再設定一段時間,側面觀察這群人的發言內容、分布的頻道來源,同時利用標記,做出市場區隔,即可做出更細緻的研究。

PR_160901_02

而當研究主題涉及較為隱晦、私密的領域,傳統的市調法不易採集此類資料時,利用篩選出的帳號,進行觀測,仍可取得民眾的行為資訊。

 

 

品牌心佔率: 以滴雞精為例

針對「滴雞精」相關的文章再進行品牌的細部分析,才發現將近一半的討論並未提及特定品牌,表示滴雞精市場的品牌印象尚未深植在半數網友的心中,表示了市場商機的潛力。接著再探索民眾重視的商品特性,諸如營養性、口味、價格等等,即可了解大眾對滴雞精與雞精的印象與重視程度的次序比。

PR_160901_04

 

有趣的是,觀察出現網友討論到滴雞精或雞精的頻道類型,並歸納網友討論的上下文內容,發現商品發言人的族群特性往往和懷孕、助孕、坐月子及寶寶營養補充有關,因此在滴雞精的案例中,當再次檢視民眾對滴雞精與雞精的印象與重視程度,我們可直覺性地推測『族群特性』是使『營養』和『口味』被高度重視的原因之一(Ex: 飲用的頻率不高,首要考量因素會是營養程度而非價格高低)。利用數據了解民眾的潛在需求、找出相關族群,即可發掘未來的隱藏商機,「掌握社群大數據與其分析方法,就握有市場的領先優勢!」

 

Copyright eLAND Information Co., Ltd.