関連情報
・出版社サイト
学術ビッグデータの更新付きデータ提供サービス
OpenAlexは、OurResearch社が2022年1月よりMicrosoft Academic Graphから引き継いだ、学術ビッグデータのオープンカタログ・サービスです。非営利組織が運営するサービスとして世界最大のデータを提供しております。
従来より、Openカタログとして無料サービスとして、ウェブサイト、API、データスナップショットを無料で提供しています。データのライセンスはCC0なので、使用も配布も自由に活用できます。非営利団体として、このデータを無料でオープンにすることはOurResearch社の使命の一部です。現在、より高いレベルのサービスをご希望のユーザーには、3つのメリットを提供するプレミアム・プランをご用意しています:
- 更新がより速くなり、より新しいデータを入手
- より多くのAPIをご利用いただけるよう、APIの上限をより高く設定
- より迅速で詳細なヘルプのための優先サポート
OpenAlex Premium
Free版 | Premium版 | |
更新頻度 | 月次(Data dump経由) | 1時間毎(API経由) |
API制限 | 100K/Day,1秒あたり10コール | 必要に応じて |
サポート | 最大限の努力 | 優先サポート |
更新頻度について
毎月OpenAlexの新しいスナップショットをリリースしています。より最新のデータをお望であれば、1時間ごとに新しい論文や変更された論文の通知を受け取るために、APIをポーリングすることができます。そのようにすることで、OpenAlexのローカルコピーは、オリジナルのOpenAlexと完全に同期されます。
これを行うには、2つのプレミアム専用APIフィルタと、プレミアム購読の一部としてお渡しする固有のAPIキーを使用することで設定できます。
APIの制限について
APIは制限として1日あたり100,000コール、1秒あたり最大10コールまでという制限があります。ただし、プレミアム・ユーザーの皆様には、プレミアムAPIキーを利用することで、1日あたり数百万のコールをサポートすることが可能です。
優先サポートについて
サポートリクエストの際、待ち行列の中で先頭で処理されます。OpenAlexをお客様のシステムに統合する方法について、お客様のチームとサポートコールを設定し、カスタムアドバイスを行うこともできます。
OpenAlexの構成要素

OpenAlexエンティティの詳細はこちら
Works:ジャーナル論文、書籍、データセット、学位論文などの学術文書
Authors:著作物を作成する人々
Sources:著作物がホストされている場所(ジャーナル、カンファレンス、リポジトリなど)
Institutions:著者が所属していると主張する大学やその他の組織
Concepts:Worksに割り当てられたトピック
Publishers:作品を配布する企業や団体
Funders:研究資金を提供する組織
Geo:世界のどこに何があるか
各種データベース比較

- Works:ジャーナル論文、書籍、データセット、学位論文などの学術文書
- Authors:著作物を作成する人々
- Sources:著作物がホストされている場所(ジャーナル、カンファレンス、リポジトリなど)
- Institutions:著者が所属していると主張する大学やその他の組織
- Concepts:Worksに割り当てられたトピック
- Publishers:作品を配布する企業や団体
- Funders:研究資金を提供する組織
- Geo:世界のどこに何があるか
OpenAlexは、学術論文、著者、研究機関、学術雑誌など、世界の研究に関する膨大なメタデータにアクセスするための強力なツールです。すべてのメタデータは、JSON形式で個別に保存されています。
OpenAlexのAPIは、制限はありますが、無料で利用できます。取得したい情報について生成AIに伝えることで、AIがスクリプトを作成してくれます。
ただし、OpenAlexの無料APIは、あまり賢くないため、さまざまなAPIエラーを返すことが少なくありません。そのため、情報を一括で取得する「倉庫」としてOpenAlexを活用し、検索の塊を作成してJSON形式でダウンロードしてから分析を行うとよいでしょう。
その利用方法の概要を以下に説明します。
1. APIの基本
・RESTful API:OpenAlex APIはRESTfulな設計になっており、HTTPリクエスト(GETメソッド)を使用してデータを取得します。
・エンドポイント:論文(works)、著者(authors)、研究機関(institutions)、学術雑誌(sources)、概念(concepts)など、データの種類ごとに異なるエンドポイントが用意されています。
・データ形式:取得できるデータはJSON形式です。
2. 利用方法の概要
・ベースURL:APIのベースURLはhttps://api.openalex.org/です。
・リクエストの構築:
– 事前準備:事前にOpenAlexのWebインターフェースで集合体を作成しておくことを推奨します。
– データタイプ:まず、どの種類のデータを取得したいか、エンドポイントをURLに追加します(例:/works で論文、/authors で著者)。
– IDによるアクセス:特定の論文や著者の詳細情報を取得したい場合は、そのID(OpenAlex ID)をURLに追加します(例:https://api.openalex.org/works/W123456789)。
– フィルタリング:特定の条件に一致するデータを検索したい場合は、filter パラメータを使用します。例えば、特定の著者が書いた論文を検索するには filter=author.id:A123456789 のように指定します。
– 検索:キーワードで検索したい場合は search パラメータを使用します。
– フィールドの指定:取得するデータのフィールドを限定したい場合は select パラメータを使用します。これにより、必要な情報のみを取得してデータ量を削減できます。
– ページネーション:多数のデータを取得する場合、page パラメータと per_page パラメータを使用して、結果を分割して取得します。デフォルトではMaxが1ページ200項目となり、その 200項目を繰り替えてして、データを入手する形となります。スクリプトを利用したAPIについては、1回10000回以内という制限があります。
・認証:OpenAlex APIは、ほとんどの利用方法においてAPIキーを必要としません。ただし、高頻度でアクセスする場合や、特定の機能を利用する場合には、メールアドレスをクエリパラメータ(mailto)として含めることが推奨されています。これにより、OpenAlex側がAPI利用者を把握し、過度な負荷がかかるような利用方法を制限することができます。
3. 具体的なユースケース
・特定の論文情報の取得:論文IDを使って、その論文のタイトル、著者、引用数などの情報を取得します。
・特定の著者の論文リストの取得:著者IDを使って、その著者が発表した論文のリストを取得します。
・特定のトピックに関する論文の検索:filter パラメータや search パラメータを使い、キーワードや概念IDに基づいて論文を検索します。
・研究機関の分析:特定の研究機関に所属する著者のリストや、その機関が発表した論文の数を調べます。
4. ドキュメントの参照
・OpenAlexの公式ドキュメントは非常に充実しており、APIの全機能、各エンドポイントの詳細、利用例が豊富に記載されています。APIを利用する際は、公式ドキュメントを参照することが最も重要です。
このように、OpenAlex APIは、学術データの分析や可視化、研究動向の追跡など、さまざまな目的で利用できる柔軟なインターフェースを提供しています。