Unsub.org について
» Unsubの数値解析についての注意事項

Unsubは、図書館や研究機関が「ビッグディール(出版社との包括契約)」の価値をOA率、利用統計、コスト、購読機関のアーカイブ、ILL等の代替手段から、ジャーナル毎の費用対効果を測定し、個別のジャーナル購読に切り替える際のコストシミュレーションを行うツールです。UnsubはRORをベースに自機関の出版物や引用を測定しております。
ここでRoRがUnsubにどのように機能しているか、主なポイントを整理しました。
1. 機関の特定とデータの紐付け(Institutional Mapping)
Unsubが提供するシミュレーションには、その機関の所属者が「どのジャーナルにどれだけ投稿し、引用しているか」というデータが不可欠です。
・課題:論文のメタデータに含まれる所属機関名は表記揺れ(例:”University of Tokyo”と”Tokyo Univ”)が多く、集計が困難です。
・解決策:RoR IDを一意の識別子として使用することで、Microsoft Academic Graph(現在はOpenAlexに移行)などの外部データベースから、その機関に関連する論文データを正確に抽出しています。
2. OpenAlexとの連携
現在、Unsubのデータソースの核となっているのはOpenAlexです。
・OpenAlexは、著者や論文の所属機関を整理するためにRoRを標準の識別子として採用しています。
・Unsubはこの構造をそのまま利用し、ユーザー(図書館員)が自機関のRoR IDを入力するだけで、瞬時に数万件の論文から自機関の成果物を特定できるようにしています。
3. 被引用数・出版数の自動算出
Unsubのダッシュボードでは、以下の指標が算出されますが、これらすべてにRoRが関わっています。
・Usage(利用量):自機関のネットワークからのアクセスだけでなく、自機関の研究者が引用した文献の傾向を把握。
・Authorship(著者貢献):自機関の研究者が「責任著者」として出版したジャーナルの特定。
これにより、「この雑誌を解約しても、自機関の研究者が多く投稿しているから残すべきだ」といった意思決定を支援します。
現在の問題は、Unsubが提示する数値の信頼性にあります。これは、Unsubの主要なデータソースであるOpenAlexのデータが信用できるかどうかという問題に帰着します。
なぜなら、Crossrefの情報には所属機関(Affiliation)情報がないものが含まれており、それをそのまま複製しているOpenAlexのデータにも、所属機関情報が欠落したレコードが存在するからです。
そこで弊社では、OpenAlexのデータベースを活用し、Elsevier社、Springer Nature社、Taylor & Francis社の全ISSNを対象に、2021年から2026年にかけて論文を各5本ずつ収集し、所属機関情報とROR IDの収録状況を確認しました。
タイトルごとのISSN情報については、以下のサイトから取得しました:
Science Direct:フリーダムコレクションに収録されるリスト
https://www.u-shizuoka-ken.ac.jp/library/news/tyouki20220124-48689-83693/
Springer Nature:Japan price
https://www.springernature.com/gp/librarians/licensing/journals-catalog/journal-price-lists
Wiley:
https://consortium.ch/wiley_titlelist_publish
Taylor & Francis:
https://taylorandfrancis.com/journals/price-lists/
プログラムコード
Science Directの結果
総タイトル数:2287

結果データ:添付のSD_Resultsをご参照ください。
Springer Natureの結果
総タイトル数:2399

結果データ:添付のSN_Resultsをご参照ください。
Wileyの結果
総タイトル数:1893

結果データ:添付のWiley resultsをご参照ください。
Taylor & Francisの結果
総タイトル数:4031

結果データ:添付のTF_resultsをご参照ください。
例えば、ScienceDirectの分析から得られたUnsubの数値は、論文の約68%に引用情報または所属機関の著者情報が含まれていると解釈できます。Unsubに表示される数値に1.47倍(100/68)を掛けた数値を念頭に置き、パッケージの解約や費用対効果の測定にご活用ください。
備考:
各出版社の結果データには、タイトルごとに生データでは「nan」と記載された項目が見られます。これは、このISSNに関するデータがOpenAlexに存在しないことを示しています。全件を追跡したわけではありませんが、「nan」が表示される主なケースとしては、ジャーナルの名称変更や出版社変更などにより、2021年から2026年のデータがOpenAlex上に存在しない場合が挙げられます。
なお、パーセンテージの算出においては、この「nan」を0としてカウントしました。
