
学術論文のオープンアクセスデータベースUnpaywallは、5月20日に大規模なアップデートを実施することを発表しました。今回のアップデートでは、コードベース全体が書き直され、より高速、高精度、そして保守性の高いシステムへと生まれ変わります。
この刷新に伴い、データにはわずかな変更が多数加えられています。Unpaywallの最新のデータベースと同期を保つためには、5月20日に公開される特別なスナップショットを一度ロードする必要があります。その他の変更は必要ありません。
リライトの背景
Unpaywallは10年近く前に開発され、その間に技術的な負債が蓄積していました。昨年には、寄せられるバグレポートへの対応が困難な状況となり、修正を加えるたびに新たな問題が発生し、既存のコード構造が改修の妨げとなっていました。このような状況を受け、Unpaywallチームはコードベースの完全な書き直しを決断し、約6ヶ月の開発期間を経て、この度完了に至りました。
変更点
今回のアップデートで変更されない点は以下の通りです。
・データ形式とスキーマ:既存の連携機能やスクリプトは、これまでと全く同様に動作します。
・APIサービス:ダウンタイムや中断は予定されていません。
・データフィード:これまでと変わらず、データは継続的に更新されます。
・データセット全体の傾向:多くの品質チェックを実施しており、ほとんどの統計値は以前と比較して5%以内の変動に留まっています。
一方、変更される点は以下の通りです。
・バグ修正の迅速化:今回のプロジェクトの最大の目的であり、バグへの対応がより迅速に行えるようになります。
・新しいウェブベースのキュレーションポータル:不正なデータを手動で修正できる新しいポータル(https://unpaywall.org/fix)が公開され、ユーザーからの修正リクエストは数日以内に適用されます。詳細は後述します。
・特定の記事のメタデータ変更:全体的なデータ傾向は大きく変わりませんが、個々の記事レベルでは多くのメタデータが変更されます。そのほとんどは、リポジトリでホストされているPDFの新しいURLへの更新といった小さな変更ですが、Gold OA(ゴールドオープンアクセス)やOAライセンスの検出精度が向上したことにより、これらの情報がより多く含まれるようになるなど、重要な変更も一部含まれます。約4,000万件のレコードに何らかの変更があり、そのうち約1,700万件はis_oa、oa_status、journal_is_oaといった重要なフィールドの変更です。
ユーザーの皆様へのお願い
今回のアップデートに伴い、ユーザーの皆様にご対応いただく必要がある事項は以下の2点です。
・変更を無視する:この場合、これまで通りUnpaywallをご利用いただけますが、最新のデータベースおよびAPIとの同期が取れなくなります。
・一時的なスナップショットによるデータベースの更新:5月20日に公開される特別なスナップショットを使用して、現在のデータベースを上書きしてください。これにより、APIとの同期が維持され、その後はこれまで通り自動的に更新されます。
データベースとの同期を維持することが非常に重要であるため、ほとんどのユーザーはオプション2を選択されると予想されます。この作業によりご迷惑をおかけすることをお詫び申し上げます。他の方法も検討しましたが、今回の移行がほぼ完全な書き換えであるため、この方法が唯一の実行可能なアプローチとなります。
新しいキュレーションUI
バックエンドの効率化に伴い、ユーザーが直接キュレーションリクエストを送信できる新しいユーザーインターフェース(https://unpaywall.org/fix)も公開されます。このキュレーションUIは、ユーザーからのフィードバックに基づいて継続的に開発していく予定です。ぜひご利用いただき、改善点などございましたらお気軽にお知らせください。
結び
近年、サポートへの対応が遅れており、皆様にご迷惑をおかけしておりましたことを深くお詫び申し上げます。迅速なサポートは私たちの誇りでありましたが、最近はその水準に達していませんでした。新しいコードベースにより、以前のように迅速かつ丁寧なサポートを提供できるよう努めてまいります。
Unpaywallや新しいキュレーションUIの改善にご協力いただける場合や、何か問題を発見された場合は、[email protected]までご連絡ください。皆様からのご意見は、Unpaywallの発展にとって非常に重要です。
皆様のご理解とご支援に感謝申し上げます。Unpaywallの新たな章を皆様と共に歩めることを楽しみにしております。
敬具
The OurResearch Team