ツイッターの発言を活用して地域レベルでの心血管疾患死亡率の予測を試みた論文
出典論文
Eichstaedt JC, Schwartz HA, Kern ML, et al. (2015) Psychological language on twitter predicts county-level heart disease mortality. Psychological Science, Vol. 26(2) 159?169.
著者の所属機関
ペンシルバニア大学心理学部
内容
敵意や慢性的なストレスは心疾患のリスクファクターとして知られているが、それらの関連性について検証するために大規模な調査を行うことは非常にコストがかかる。著者らは、ツイッターでの心理的な発言を用いて、米国において最も死亡率の高いアテローム動脈硬化性心疾患(Atherosclerotic Heart Disease;AHD)による年齢調整死亡率と、地域レベルでの心理的な特性との関連性を検討した。使用データは、2009年から2010年における米国の1,347の群における148百万のツイッターでの発言(発言地域が特定されたもの)と、米国疾病予防センター(Centers for Disease Control and Prevention; CDC)より得られた地域ごとの年齢調整したAHDによる死亡率であった。 結果、ネガティブな社会的な関係性や、やる気の低下(Disengagement)、ネガィブな感情(とくに怒り)を反映したツイッターでの発言パターンが、心疾患のリスクファクターとして抽出された。一方、ポジティブな感情や仕事への没頭(Engagement)は心疾患の予防要因として抽出された。このような関連性は、収入や教育レベルを調整したとしても、ほとんどの関連性が有意であった。さらに、ツイッターの発言のみを用いてAHDを予測する横断的な回帰モデルでは相関係数が0.42で、人口統計、社会経済状態、健康リスク要因(喫煙や糖尿病、肥満、高血圧)等、10個の因子を用いた予測モデルでは0.36で、ツイッターの発言のみを使用した予測モデルの方がAHDによる死亡率を有意に高い予測率であった。さらに、ツイッターでの発言のみを用いた予測モデルとCDCによって報告された地域ごとのAHDによる死亡率は非常に類似していることが示唆された。
以上の事から、著者らは、ソーシャルメディアを通じて地域の心理的特徴を把握することは実現可能性が高い手法であることと、地域レベルでの心疾患の死亡率の有力な予測指標として活用できると結論付けた。
解説
本研究は、ソーシャルメディアを活用して地域レベルで心疾患による死亡率を予測したユニークな研究である。ツイッターでのネガティブおよびポジティブな発言を収集し、予測モデルを構築するという手法は、従来の大規模調査に比べてコストが非常に低く抑えられるという利点がある。また、研究の発展性と言う視点から言えば、例えば、心疾患に限らず慢性的な疲労やメンタルヘルス、睡眠障害、事故の発生等の予測にも応用可能かもしれない。ただし、本論文でも著者らが触れているように、ソーシャルメディアを使用する年齢層は比較的、若年者であるのに対して、心疾患で死亡するのは高齢の者であり、ネガティブな発言が原因となって、心疾患を引き起こすという因果関係については、本論文のデータから論じることはできないとしている。その点について著者らは、ツイッターでの発言は彼らを取り巻く職場や、地域等の環境に対する反応であるので、複雑な経路を経て、それらが結びついているのかもしれないという推測を呈している。様々な研究の限界はあるものの、本研究はビッグデータを応用、活用した調査研究であり、今後の発展性が期待される1つの知見である。