チリにおける大規模言語モデル(LLM)を活用した労働災害報告データの分類と活用の試み
出典論文
Dunstan, J., Campaña-Herrera, V., Miranda, L. et al. Sex differences in work-related accidents extracted from free text in Spanish using natural language processing. BMC Public Health 25, 2746 (2025). https://doi.org/10.1186/s12889-025-24130-z
著者の所属機関
Department of Computer Science and Institute for Computational Mathematics, Pontifical Catholic University of Chile. Santiago, Chile.
論文の内容
既存研究は、欧米などグローバル・ノースの国々において労働災害や職業病の発生率に明確な性差があることを示しています。一方で、それ以外の地域、とくにグローバル・サウスではデータが乏しいです。本研究は、チリ最大の労災保険・産業保健サービス機関であるACHS(Asociación Chilena de Seguridad)の受診報告書、約34万件(2022〜2023年)を対象に、自然言語処理(NLP: Natural Language Processing)を用いて労働災害の発生メカニズムと職種情報を抽出し、性別による違いを検討しました。報告書に自由記述された職種名は、国際労働機関(ILO: International Labour Organization)の国際標準職業分類に基づき標準化し、発生メカニズムは同じくILOの階層的分類に従って大規模言語モデル(LLM: Large Language Model)※1 により自動コード化したうえで、人間アノテータ※2 によるラベルと比較して性能評価を行いました。その結果、LLMによる発生メカニズムの自動分類は、人手ラベル※3 と比べて中程度の精度であるものの、労働災害の大規模分析において職種やメカニズムの性差パターンを把握するには有用でした。労働災害については、被災者の57.3%が男性、42.7%が女性であり、男性で最も多い職種は車両運転・重機オペレーター、女性では清掃・家事関連業務でした。男性に最も多い発生メカニズムは「鋭利物との接触」であり、女性では「平地での転倒」でした。著者らはプロンプトとプログラムコードを公開しており、他機関・他国でも本研究で用いられた自由記述テキストからILOの分類体系に基づく重要情報を抽出する手法を利用できます。通勤災害および職業病の詳細な分析は、今後の研究課題です。
※1:LLMとは、自然言語の入力に対して、適切な応答を出力するシステムであり、本研究ではGPT-3.5-turbo、GPT-4o-mini、GPT-4oが使用された。
※2:人間アノテータとは、入力データに対して人手ラベルを作成する者であり、本研究では、ILOの分類に関する教育を受けた2名がアノテータとなった。
※3:人手ラベルとは、LLMではなく、人間が特定の入力データに対して適切な出力ラベルを付けたものであり、本研究では、受診報告書に対して、職業や発生メカニズムの分類結果がラベルとして付与された。
RECORDsメンバーによる解説
本研究では、ACHSが収集した受診報告書を分析し、LLMによる職種名の標準化と災害メカニズム抽出を行いました。ACHSは、非営利の保険・医療サービス機関であり、労災・通勤災害・職業病に対する予防プログラムや補償を担っています。加入者は、約260万人で、チリの被雇用者の約51%です。自由記述の災害報告から有益な情報を抽出し、災害防止に生かすことは世界共通の課題であり、本研究ではその手段としてLLMを用いたテキスト解析を行いました。LLMは大量の文章を学習した生成AI(Artificial Intelligence、人工知能)で、自然言語の入力に対して、自然な応答を出力できるため、表現の統一や共通パターンの抽出に適しています。本研究では、OpenAI社のLLMであるGPT-3.5-turbo、GPT-4o-mini、GPT-4oを使用して、ACHSの受付担当者や診察を行った医師が記述した労働災害報告データの自由記述を分類し、男女間の労働災害発生メカニズムや職種分布の違いを検討しました。その結果、チリでも、グローバル・ノースの国々と類似した男女間の職業分離やそれに伴う災害発生メカニズムが確認されました。ただし、LLMで作業を完全に自動化できるわけではありません。LLM出力の人間の専門家ラベルとの一致は中程度にとどまるため、人手評価を並行して行う必要があります。LLMの出力を個々の事例の最終判断に用いるのではなく、集団レベルで職種差や性差のパターンを捉え予防策を検討するなど、細かな分類精度の不十分さに配慮した活用方法が求められます。また、多くの労災報告データには個人情報が含まれているので、匿名化やローカルLLMの使用などが課題となります。日本においても、こうした限界を踏まえつつLLMを活用することで、既存の労働災害データから災害防止に役立つ知見を抽出できる可能性があります。