OpenAlexのAffiliation情報についての注意事項
1. 機関の特定とデータの紐付け(Institutional Mapping)
OpenAlexのROR(Research Organization Registry)の採択:
その機関の所属者が「どのジャーナルにどれだけ投稿し、引用しているか」というデータが不可欠です。そのため、OpenAlexは、著者や論文の所属機関を整理するためにROR(Research Organization Registry)という永続識別子を標準の識別子として採用しています。
- 課題: 論文のメタデータに含まれる所属機関名は表記揺れ(例: “University of Tokyo” と “Tokyo Univ”)が多く、集計が困難です。
- 解決策: RoR ID を一意の識別子として使用することで、Microsoft Academic Graph(現在はOpenAlexに移行)などの外部データベースから、その機関に関連する論文データを正確に抽出しています。時に数万件の論文から自機関の成果物を特定できるようにしています。
2. OpenAlexのAffiliationデータについて
OpenAlexのデータが信用できるかどうかという問題に帰着します。OpenAlexの多くのデータがCrossrefの情報から由来しており、そのメタデータには、所属機関(Affiliation)情報がないものが含まれており、それをそのまま複製しているOpenAlexのデータにも、所属機関情報が欠落したレコードが存在するからです。
そこで弊社では、OpenAlexのデータベースを活用し、Elsevier社、Springer Nature社、Taylor & Francis社の全ISSNを対象に、2021年から2026年にかけて論文を各5本ずつ収集し、所属機関情報とROR IDの収録状況を確認しました。
タイトルごとのISSN情報については、以下のサイトから取得しました:
Science Direct:フリーダムコレクションに収録されるリスト
https://www.u-shizuoka-ken.ac.jp/library/news/tyouki20220124-48689-83693/ (現在デッドリンクです)
Springer Nature:Japan price
https://www.springernature.com/gp/librarians/licensing/journals-catalog/journal-price-lists
Wiley:
https://consortium.ch/wiley_titlelist_publish
Taylor & Francis
https://taylorandfrancis.com/journals/price-lists/
プログラムコード
プログラムはこちらからダウンロードできます。(Wileyの例となります)
Wileyの元となるフォーマットのデータは、このフォーマットです。
各出版社ごとのRORとAffiliationデータの収録状況についての結果は、以下の通りです。
Unsubにてそれぞれのパッケージを分析する時には、それぞれの平均パーセンテージを考慮した上でUnsubから出力される数値をご確認ください。
Science Directの結果(誌名変更及び終了ジャーナルも含む結果)
総タイトル数:2287
| 平均 | 2026年 | 2025年 | 2024年 | 2023年 | 2022年 | 2021年 | |
| Affiliation | 68.21% | 57.20% | 68.87% | 70.94% | 71.40% | 70.83% | 70.01% |
| ROR | 68.18% | 57.16% | 68.83% | 70.91% | 71.40% | 70.82% | 69.99% |
結果データ 添付のSD_Resultsをご参照ください。
Science Directの結果(現在Activeのみのジャーナルを含む結果)
総タイトル数:1811
| 平均 | 2026年 | 2025年 | 2024年 | 2023年 | 2022年 | 2021年 | |
| Affiliation | 86.28% | 73.44% | 87.36% | 90.08% | 90.04% | 89.03% | 87.73% |
| ROR | 86.25% | 73.38% | 87.31% | 90.06% | 90.03% | 89.02% | 87.71% |
結果データ 添付のSD_Resultsをご参照ください。
上記は、ISSNでフィルタをかけて検索させております。上記の2021年から2026年の間に誌名が変更になった場合や同期間の新刊については、誌名では、過去の論文が取得することができないケースがありますので、参考数値としてご確認ください。
0038-0717 2026年 旧データ 60%、新データ 20%
0038-092X 2026年 旧データ 60%、新データ 80%等 異なる数値があります。
OpenAlex APIから取得する「最新5本の論文」のデータが、同じISSNと年を指定しても、取得するタイミングによって異なる可能性があるため、パーセンテージに変化が生じることが考えられます。
主な理由としては、以下の点が挙げられます。
- OpenAlexのデータ更新: OpenAlexのデータベースは常に更新されており、新しい論文が追加されたり、既存の論文の情報が修正されたりすることがあります。そのため、以前データを取得した時と、今回データを取得した時との間で、その年に公開された「最新5本」として選ばれる論文のセットが変わってしまう可能性があります。
- 出版日の粒度とソート順: OpenAlex APIはsort=’publication_date:desc’で最新の論文を取得していますが、出版日が同じ論文が複数ある場合、OpenAlex内部でのソート順が時間経過やデータの追加によってわずかに変動し、取得される「最新5本」の論文の組み合わせが変わることが考えられます。
これらの要因により、同じスクリプトで同じ条件を指定しても、異なるタイミングで実行すると、取得される生データ(最新5本の論文)が変わり、結果として計算されるパーセンテージに差異が生じることがあります。
Springer Natureの結果
総タイトル数: 2399
| 平均 | 2026年 | 2025年 | 2024年 | 2023年 | 2022年 | 2021年 | |
| Affiliation | 91.42% | 83.04% | 94.32% | 93.49% | 92.97% | 92.87% | 91.86% |
| ROR | 91.39% | 82.97% | 94.24% | 93.48% | 92.95% | 92.85% | 91.86% |
結果データ 添付のSN_Resultsをご参照ください。
Wileyの結果
総タイトル数:1893
| 平均 | 2026年 | 2025年 | 2024年 | 2023年 | 2022年 | 2021年 | |
| Affiliation | 79.80% | 79.20% | 82.99% | 80.17% | 79.54% | 78.76% | 78.12% |
| ROR | 79.79% | 79.17% | 82.96% | 80.17% | 79.54% | 78.76% | 78.11% |
結果データ 添付のWiley resultsをご参照ください。
Taylor & Francisの結果
総タイトル数:4031
| 平均 | 2026年 | 2025年 | 2024年 | 2023年 | 2022年 | 2021年 | |
| Affiliation | 90.78% | 83.24% | 92.67% | 92.59% | 92.64% | 91.73% | 91.83% |
| ROR | 90.77% | 83.20% | 92.65% | 92.59% | 92.64% | 91.73% | 91.83% |
結果データ 添付のTF_Resultsをご参照ください。
備考:
各出版社の結果データには、タイトルごとに生データでは「nan」と記載された項目が見られます。これは、このISSNに関するデータがOpenAlexに存在しないことを示しています。全件を追跡したわけではありませんが、「nan」が表示される主なケースとしては、ジャーナルの名称変更や出版社変更などにより、2021年から2026年のデータがOpenAlex上に存在しない場合が挙げられます。
なお、パーセンテージの算出においては、この「nan」を0としてカウントしました。

