📊 OpenAlex:研究資金データプロジェクトの現状と展望
以下のウェビナーでは、学術情報のグラフ化を進める「OpenAlex」プロジェクトにおいて、これまで「最も閉ざされた領域」であった研究資金(グラント)データをいかにオープン化し、活用可能にするかについての進捗と戦略が共有されました。
🔓 なぜこのプロジェクトが重要なのか?
現在、研究資金に関するデータは、 proprietary(独占的)なデータベースやPDF、あるいは各機関のサイロ化されたシステムの中に閉じ込められています。
- 資金提供者(ファウンダー): 自らの資金がどのような成果(論文など)に結びついているか全体像が見えない。
- 研究者・分析者: 戦略的な分析を行うためのオープンなグラント・論文リンクが存在しない。
OpenAlexは、世界中のグラント情報を統合し、誰でも無料でアクセスできる「オープンな学術グラフ」の完成を目指しています。
🚀 現在の到達点
- 「Award(賞/助成金)」のエンティティ化: グラントをOpenAlexの主要なデータ形式として実装完了。
- 膨大なデータ量: 約1,500万件の助成金レコードを保持し、そのうち約700万件は資金提供者から直接取り込んだデータです。
- アクセシビリティ: APIおよびUIを通じて、資金提供者、金額、期間、PI(研究代表者)などでフィルタリング・探索が可能になっています。
🛠 データ収集の仕組み
OpenAlexは、単一のソースに頼らず、複数のルートでデータを統合しています。
- Crossref経由: 出版社がDOI登録時に提供する資金情報を活用。
- 直接インジェスト: 資金提供者のデータベースから直接データを取得。
- テキストマイニング: 論文の謝辞セクションから資金情報を抽出。
- ヒューマン・イン・ザ・ループ: 自動化されたパイプラインに加え、必要に応じて人間による検証を行い、データの信頼性を担保しています。
🗣 資金提供者からのフィードバックとニーズ
世界中の資金提供者へのインタビューから、以下の共通ニーズが浮き彫りになりました。
- 「車輪の再発明」を避ける: 既存のオープンな取り組み(Open Research Funder Groupなど)と連携してほしい。
- データ衛生(Data Hygiene)の課題: 形式の不一致や品質管理の難しさが最大の障壁。
- ダッシュボードへの期待: 独自の分析ツールだけでなく、コンプライアンス管理やポートフォリオ分析ができる「オープンな代替ツール」を求めている。
🔮 今後のロードマップ
- スケーリング: 直接インジェストのパイプラインを強化し、取り込む資金提供者の数を数千規模へ拡大。
- サブアワード(再配分)の追跡: 資金がどのように流れているかの可視化。
- キュレーション機能: 研究者や資金提供者が、誤ったリンクを修正したり、情報を補完したりできる双方向の仕組みを強化。
- 資金提供者コミュニティの形成: 地域や分野ごとのアンバサダーを募り、オープン化を推進するネットワークを構築。
💡 まとめと参加方法
OpenAlexは、研究資金データを「孤立した情報」から「つながった知識」へと変革しようとしています。
- 研究者の方: OpenAlexのAwardsページを探索し、フィードバックを送ってください。
- 資金提供者の方: データを公開し、OpenAlexのコミュニティグループに参加して、オープンサイエンスの未来を一緒に作りましょう。
- 出版社の方: CrossrefやDataSiteを通じて、資金情報を正確に登録し続けることが、このエコシステムを支える鍵となります。
「資金提供の透明性が高まれば、科学の進歩はもっと加速する」。OpenAlexの挑戦は、まさにその実現に向けた重要な一歩です。🚀

