化学情報協会

結晶構造データが導く化学の新時代

CCDC新所長インタビュー

2026年2月掲載

The Cambridge Crystallographic Data Centre 

Executive Director, Suzanna C. Ward

英国のCCDC(The Cambridge Crystallographic Data Centre、ケンブリッジ結晶学データセンター)と化学情報協会(JAICI)は、「化学分野で公共の利益に資する」というミッションを共有しています。2025年7月にCCDCのExecutive Director(所長)に就任したSuzanna Ward氏に、CCDCのミッションとビジョン、そしてAI時代に求められる能力についてインタビューしました。 ※聞き手は、JAICI理事長 上野京子。 

ミッション・ビジョン――公共の利益を軸に

JAICI:私たちのミッションは、「化学分野で公共の利益に資すること」を掲げ、CAS製品を中心として、日本の民間企業やアカデミックの方々にデータベースの提供ならびにユーザサポートを行っています。CCDCのミッションとビジョンについて、お聞かせください。

Suzanna Ward:CCDCのミッションは、公共の利益のために化学と結晶学を発展させることです。その主な手段がCSD(Cambridge Structural Database、ケンブリッジ結晶構造データベース)のキュレーションと関連ソフトウェアの提供です。私たちのビジョンは、構造化学データ・人・科学的ツールを結びつけ、現実世界の科学的課題を解決するための触媒になることを目指しています。これはCCDCの創設者であるOlga Kennard博士の「データの集合的活用が新たな知識と洞察につながる」という考え方に基づいています。信頼できるデータとツールを提供し、科学者と連携し、知識や資源を共有しながら科学的発見を可能にすることがCCDCの役割です。

CCDCは2025年に創立60周年を迎えました。Kennard博士の過去の講演原稿を振り返る機会があったのですが、そこには「進歩はビジョン・協働・目的から生まれる」と記されていました。これら3つの要素は、現在も組織運営の中心となっています。CCDCは学術界、産業界、CASなどの科学情報機関、そして世界中の結晶学者との強固なパートナーシップに支えられてきました。我々のミッションの達成に、こうした協働が大きく貢献しています。またKennard博士は、データ品質を常に重視しており、50周年の記念講演でも創立当初から精緻なチェック体制を設け、研究者が自信を持ってデータを使えるようにしたと話されていました。AIが台頭してきている今日、その重要性が一層増しています。結晶モデルの妥当性は、背後にあるデータの品質に依存するため、品質第一の原則は今も全ての業務に強く根付いています。

CCDCは、CSDが今後も実験データを信頼できる形で精選したリソースとして、重要な役割を果たし続けると考えています。60周年に合わせ、「Frontiers in Chemistry」というテーマのwebinarを3つ企画しました。パネルディスカッション形式で、「Big TechがBig Pharmaを超える可能性の探究」、2025年のノーベル化学賞との関連で金属有機構造体(MOF)の将来を取り上げ、「データと構造情報学が今後の方向性をどう導けるか」、そして「データや化学教育」について議論しました。オンデマンド(Webinars)で録画を公開しておりますので、よかったらご覧になってください。

高品質で信頼を築く

JAICI:キュレーションにおける品質管理が重要かと思いますが、質を高い水準に保つため、どのような取り組みをしていらっしゃいますか。

Suzanna Ward:データの精査は、自動化と人による確認の両方を組み合わせて行っています。オンラインのweb経由の登録システムを導入し、国際結晶学連合(IUCr)のcheckCIFを用いた検証を組み込んでいます。研究者自身が、結晶データの提出時にファイル形式や検証情報を確認することで、より正確なデータが登録されます。

CCDCのサーバにデータが届くと、まず自動処理が実行されます。提出されたデータファイルには通常、化学的な結合情報がなく、原子座標のみが含まれているため、意味のある化学的表現、つまり2次元の化学構造を付与することが必要です。これは後続の研究にとって不可欠な作業ですが、CCDCでは自動化しています。その後、CSDの既存のデータを使って、自動発生させた分子の2次元構造が化学的に正しいかを検証します。金属錯体など結合次数の判断が難しい結晶構造が増えており、既存のデータからの検証は作業効率に大きく貢献します。次に2次元構造に対し、人手による確認を行います。このようにして、信頼できるデータベースを構築しています。また私たちは、論文投稿された結晶構造データに捏造も含めた科学的に正しくないデータが含まれているかもしれないことを認識しており、出版社と緊密に連携してその特定と防止に取り組んでいます。ご存じの方もいらっしゃると思いますが、論文投稿時、論文の著者は、結晶構造データをCCDCに提出することになっていますので、査読時に確認すべき点を出版社に助言し、必要に応じて問題を指摘することで支援しています。

結晶データを利用しているエンドユーザ向けの取り組みとしては、データベースには140万件を超える結晶構造を収録していますので、カスタマイズした検索条件を指定したり、フラグやフィルターを使って目的に合ったデータを選択できるようにしています。現在、基盤となるデータベースの形式を見直し、各エントリーにより多くの情報を追加できるように改良しています。

データサイエンスと標準化への取り組み

JAICI:AIや機械学習が注目される中で、CCDCはデータサイエンスの分野でどのような役割を果たしているのでしょうか。

Suzanna Ward:構造データから新しい知見を引き出す鍵は、データサイエンスだと考えています。CSDに蓄積された構造データは非常に価値があり、その活用は産業界との協力で進んでいます。具体的には、製薬企業とのパートナーシップをあげることができます。例えば、固体製剤開発における合理的設計ツールの不足に対応するため、企業と共同でコンソーシアムを立ち上げました。この取り組みから、構造情報をインフォマティクス的に生かしたツールが生まれ、CSD-MaterialsCSD-Particleが開発されました。新薬設計や固体形態選択のリスク軽減に役に立つことから、世界中で活用されています。まさにデータサイエンスの力を実感できるケースと言えるでしょう。製薬企業から直接フィードバックを得ることで、現場の課題に対応し、企業のニーズに的確に応える製品づくりを行っています。

製薬企業だけでなく、材料科学の分野でも機械学習の手法を取り入れた研究が増えています。その際、CSDのような高品質データが不可欠です。自社で保持するデータとCSDを組み合わせて活用するケースが多いと思いますが、CCDCは、各社がCSDと同様のツールを使って自社の構造データベースを構築できるよう、CSD Python APIや関連ソフトウェアを提供し、AIやデータサイエンス技術を適用できるようにしています。CCDCのウェブサイトのCase Study でも紹介しています。

ユーザの方から最も多く寄せられる要望は、「アクセシビリティ」の保証です。エンドユーザは必ずしも結晶学者ではないため、異なる分野の方でも理解していただけるようにすることが重要です。現在、高度なユーザにはローカルにインストールして使用するデスクトップソフトウェアを、一般ユーザには簡単に閲覧できるショーウィンドウ的なwebインターフェイスで利用できるようにしています。近年、デスクトップソフトウェアは、CSDのデータ量の増加に伴い、個々のPCへのインストールが困難になりつつあるため、サーバで一括管理するwebインターフェイスに統合することを計画しています。新しく開発したwebインターフェイスでは、前述のようにデータベースフォーマットを強化し、外部リンク機能を充実することが可能となります。

JAICI:データの標準化について、CCDCはどのような取り組みをしていますか。

Suzanna Ward:CCDCには強力なScience Research TeamとData Teamがあり、両者が密接に連携しています。データの標準化は非常に重要なテーマで、CCDCはこの分野に大きくかかわっています。例えば、結晶業界で広く使われているCIF(結晶学情報ファイル)の策定にはCCDCの研究者だったFrank Allenが関わりました。現在もIUCrのCOMCIFSと協力して、結晶構造予測データセットの標準辞書を作成しています。さらに、データチームのIan BrunoはIUPACと連携し、金属有機構造に対するInChIの拡張にも取り組んでいます。CSDの豊富なデータセットを活用してベンチマークを行い、CSD Python APIにも新しいInChIを統合しました。科学とデータの研究は密接に結びついています。

持続可能なアクセスモデル

JAICI:世界的な価格上昇の中で、学術機関は限られた予算で厳しい選択を迫られています。この問題は日本だけでなく世界共通だと思いますが、イギリスではどうですか。

Suzanna Ward:イギリスでも同じです。大学は予算不足で苦しんでいます。特に理系は設備や人件費がかかるので、化学科を閉鎖したり、他の学科に統合したりする大学もあります。出版社やデータベースの料金だけでなく、教育全体のコストが問題になっています。CCDCは非営利団体なので、利益を株主に渡す必要はありませんので、データベースを維持、そして、皆様が利用できる環境を維持するために活用しています。具体的な運営方針は、持続可能性を最優先にハイブリッドモデルを採用しています。一部データは無料公開(Access Structure)し、誰でもアクセス可能な入口を用意しています。一方、高度なサービスは有料にすることで、長期的な運営と品質維持を図っています。

データ収集とキュレーションは、研究者の方に直接登録していただいたり、一部のプロセスを自動化することで極力コストを抑えるようにしています。また、世の中には論文として発表していないデータも多くありますので、CSD-Communicationsという仕組みを作り、論文化されていない結晶構造の収集も行っています。現在、新規に登録されるデータの約10%はこの方法で登録されています。この取り組みは、1980年代から始まり、当時はPrivate Communicationsと呼ばれていました。最近はより積極的に取り組み、各データにISSNやDOIを付与して公開しています。紙ベースでの古いデータの寄付もあり、学生に依頼し、インターンとして入力作業を手伝ってもらっています。引退される先生方には、ぜひデータ提供に協力していただければと思っています。データが共有されなければ、新しい知見は生まれません。

CCDCはデータサイエンスコミュニティの一員として、次世代の科学者の育成に責任を持っています。世界中の大学と連携し、博士課程の学生を支援するプログラムを実施しています。Frank Allenにちなんだ育成基金もあります。これにより、将来のデータサイエンティストに適したツールを提供しながら、彼らの成長をサポートしています。

生成AI時代に求められる“評価力”

JAICI:以前は、使いこなすのが難しい製品を専門職の方が使われていましたが、最近は簡単にアクセスできるツールが開発され、利用者層が広がりました。その一方で、理解度の不足や製品が十分に使い込まれていないように感じます。

Suzanna Ward:そうですね、専門職の方々は深く理解して使っていました。確かに幅広いユーザに届くのは良いことですが、研究に必要な“評価力”が伴わないケースは増えていますね。これからの時代、検索結果や計算結果をそのまま信じるのではなく、情報の出所やアウトプットの信頼性を評価する力が必要です。それは科学の基本であり、研究者にとって不可欠なスキルと考えています。生成AIの登場で、結果が完璧に見えるため、疑うことが難しくなっています。私たちCCDCが強調したいのは、データの質だけでなく、その評価力です。Google検索やAIの結果をどう解釈するかは、科学技術の核心です。そこを失わないようにすることが、今後の課題だと思います。

JAICI:次世代の研究者に科学や化学への興味を持たせることも、未来に向けて欠かせないテーマですね。最後に、日本の研究者の皆さんへのメッセージをお願いします。

Suzanna Ward:日本の研究者の皆さんには、CSD製品をもっと活用していただきたいと思います。データから新しい知見を生み出す可能性は非常に大きいです。そしてぜひ、JAICIを通じてCCDCにコンタクトしてください。皆さんの声が、私たちのサービスを進化させる力になります。CCDCは皆様の声に耳を傾け、応え、そこから学んでまいります。またお話しできることを楽しみにしています。

CCDC紹介

The Cambridge Crystallographic Data Centre (CCDC)
12 Union Road
Cambridge, CB2 1EZ
United Kingdom

1965年に設立された非営利組織で、結晶構造データの収集・管理・解析に関する専門機関。代表的なデータベースであるCambridge Structural Database(CSD)は、140万件以上の有機・金属有機結晶構造データを収録し、構造化学・材料科学・創薬研究など幅広い分野で利用されている。CCDCは、データのFAIR原則(Findable、Accessible、Interoperable、Reusable:検索可能・アクセス可能・相互運用可能・再利用可能)に基づく公開、教育・アウトリーチ活動、機械学習や計算化学への応用を推進している。主要なソフトウェアにはMercury、ConQuest、CSD Python APIなどがあり、学術研究・産業界における結晶構造解析の標準ツールとして広く採用されている。英国ケンブリッジを拠点に、国際的な研究者コミュニティと連携し、結晶学の発展に貢献している。

Suzanna C. Ward (スザンナ・C・ウォード)

CCDCのExecutive Director。サウサンプトン大学にて化学修士号(Master of Chemistry with Professional Training)を取得し、Mike Hursthouse教授の指導の下で結晶学を専攻。CCDCにScientific Editorとして入所後、Head of Database、Head of Data and Communityを歴任し、2025年より現職。British Crystallographic Association副会長、IUCr結晶学教育委員会コンサルタントを務める。主な研究分野は結晶学、構造データのFAIR化、データ駆動型科学。

化学情報協会では、CSDやICSDなどX線構造解析で決定された結晶構造のデータベースや物性データベースを扱っております。

製品・サービス