Sagace −Microdata · 2017. 2. 9. · (Google Rich Snippetsに倣っています)....

1
インターネット上には数多くの種類の検索エンジンが存在するが,特定の専門分野の データベースを効率良く得ることが苦手である.一方で創薬・疾患分野の検索システム は,多種多様な形式のデータベースを横断的に検索し、一度に表示することは不得手で ある. そこで,我々はユーザーが探している創薬・疾患に関連した情報を得やすくするような 検索システム“Sagace http://sagace.nibio.go.jp/”を開発した .Sagaceでは, バイオサイエンスデータベースセンター(NBDC),経済産業省ライフサイエンス プロジェクトポータルサイト(MEDALS),農林水産生物ゲノム情報統合データベース (AgriTOGO)と連携し,それぞれの連携機関で構築された検索用のインデックス ファイルを共有し,検索結果に反映させている. Background Sagace の使い方( Sagace でさがす!) Sagace の今後Microdata を使用したメタデータの活用 Sagace の3大特徴 医学/生命科学に特化したデータベースの選定と分類 ファセットを用いた効率的な検索結果の絞り込み メタデータの利用による検索結果の可読性の向上 ◯伊藤真和吏 1) ,森田瑞樹 1),5) ,五十嵐芳暢 2) ,陳怡安 1) ,長尾知生子 1) 坂口由希 3) ,坂手龍一 4) ,増井徹 ) ,水口賢司 1) 所属: 1) 医薬基盤研究所 創薬基盤研究部 バイオインフォマティクスプロジェクト, 2) 同研究所 創薬基盤研究部 トキシコゲノミクス・インフォマティクスプロジェクト, 3) 同研究所 難病・疾患資源研究部 政策・倫理研究室, 4) 同研究所 難病・疾患資源研究部 難病資源研究室, 5) 東京大学 知の構造化センター リスト 検索方法 ファセット データベースの種類 生物種 スニペット(検索結果の説明文) タイトル リッチスニペット(付加情報) ファセット 生物種 選択した生物種のみに絞り込み データベース名 選択したデータベースのみに絞り込み リッチスニペット Sagaceではメタデータの活用による検索結果の可読性と精度の向上に取り組んでいる. これはデータ自身が何を意味するかということをmicrodata形式を使用して明示すること で,それらを検索結果に表示し,検索結果のランキングにも活かそうという試みである. 現在,エントリーID,生物種,データベース名などをライフサイエンス独自のmicrodata のプロパティとして提案している(ライフサイエンス以外の分野では既に一般的な検索 エンジンに検索結果として反映されている).Sagaceではmicrodataを取り入れる データベース公開者と試みに協力(&|/)議論してくださる方を大募集している. Sagaceマークアップ・スキーマ http://sagace.nibio.go.jp/schema/schema.html ファセットを使って 効率的に検索結果を 絞り込める. 検索結果 リッチスニペットを3種類(①,②,③) 用いることでより有用な検索結果を表示. ① データベース名を利用した結果の絞り込み ③ 生物種を利用した結果の絞り込み ファセット…情報の切り口の意味.Sagaceでは, データベースを特徴毎に分類した項目を指す. 何らかの項目の集合があるときに,各項目の それぞれを複数の切り口で分類し,それらの 組み合わせで一つの項目を表現する方法を ファセット分類法(分析合成型分類法)と呼ぶ. この分類法を用いた項目の絞り込み方法を ファセットナビゲーションという. 生物学的な情報は必ずしも階層型構造に入れて 分類できないことも多い.ファセット型分類法は, 検索対象のデータに対して,タグ付のように分類 項目を設定できれば,それらを組み合わせて使える ため,柔軟にデータを分類し,検索結果に活かせる. これらの理由からSagaceでは,ファセットを 使用している. データベース分類 ② データベース分類を 利用した結果の絞り込み スニペット…情報の断片の意味.検索においては 検索結果の説明文を指す. リッチスニペット…検索結果の付加情報のこと. 検索結果には通常,タイトル,URL,スニペット などが含まれる.Sagaceが検索対象としている データベースのエントリーには説明文が書いて いないことが多く,また書いてある場合でも それが自分の目的のものかを判断することが難しい 場合が多くある.そこで,タイトルとスニペットに 加え,Sagaceではそれ以外のメタデータを検索 結果に付与している.この付加情報を Sagaceではリッチスニペットと呼んでいる (Google Rich Snippetsに倣っています). 用語解説&ここがポイント!その3 メタデータ…データ自身に関する 情報を持ったデータ.Sagaceでは, メタデータを利用することで検索結果の 可読性の向上につとめている. 用語解説&ここがポイント!その1 用語解説&ここがポイント!その2 Licensed under a Creative Commons表示2.1日本 license (c)2012 伊藤真和吏(独立行政法人 医薬基盤研究所)

Transcript of Sagace −Microdata · 2017. 2. 9. · (Google Rich Snippetsに倣っています)....

Page 1: Sagace −Microdata · 2017. 2. 9. · (Google Rich Snippetsに倣っています). 用語解説&ここがポイント!−その3 メタデータ…データ自身に関する

インターネット上には数多くの種類の検索エンジンが存在するが,特定の専門分野のデータベースを効率良く得ることが苦手である.一方で創薬・疾患分野の検索システムは,多種多様な形式のデータベースを横断的に検索し、一度に表示することは不得手である. そこで,我々はユーザーが探している創薬・疾患に関連した情報を得やすくするような検索システム“Sagace http://sagace.nibio.go.jp/”を開発した .Sagaceでは, バイオサイエンスデータベースセンター(NBDC),経済産業省ライフサイエンス プロジェクトポータルサイト(MEDALS),農林水産生物ゲノム情報統合データベース(AgriTOGO)と連携し,それぞれの連携機関で構築された検索用のインデックス ファイルを共有し,検索結果に反映させている.

Background  

Sagaceの使い方(Sagaceでさがす!)  

Sagaceの今後−Microdataを使用したメタデータの活用  

Sagaceの3大特徴  ① 医学/生命科学に特化したデータベースの選定と分類 ② ファセットを用いた効率的な検索結果の絞り込み ③ メタデータの利用による検索結果の可読性の向上

◯伊藤真和吏1),森田瑞樹1),5),五十嵐芳暢2),陳怡安1),長尾知生子1),  坂口由希3),坂手龍一4),増井徹3),水口賢司1)

所属:1)医薬基盤研究所  創薬基盤研究部  バイオインフォマティクスプロジェクト,2)  同研究所  創薬基盤研究部  トキシコゲノミクス・インフォマティクスプロジェクト,  3)  同研究所  難病・疾患資源研究部  政策・倫理研究室,4)  同研究所  難病・疾患資源研究部  難病資源研究室,5)  東京大学  知の構造化センター

リスト

検索方法

ファセット データベースの種類

生物種

スニペット(検索結果の説明文)

タイトル リッチスニペット(付加情報)

ファセット

生物種

選択した生物種のみに絞り込み

データベース名

選択したデータベースのみに絞り込み

リッチスニペット

Sagaceではメタデータの活用による検索結果の可読性と精度の向上に取り組んでいる. これはデータ自身が何を意味するかということをmicrodata形式を使用して明示することで,それらを検索結果に表示し,検索結果のランキングにも活かそうという試みである. 現在,エントリーID,生物種,データベース名などをライフサイエンス独自のmicrodataのプロパティとして提案している(ライフサイエンス以外の分野では既に一般的な検索 エンジンに検索結果として反映されている).Sagaceではmicrodataを取り入れる データベース公開者と試みに協力(&|/)議論してくださる方を大募集している. Sagaceマークアップ・スキーマ http://sagace.nibio.go.jp/schema/schema.html

ファセットを使って 効率的に検索結果を 絞り込める.

検索結果

リッチスニペットを3種類(①,②,③) 用いることでより有用な検索結果を表示.

① データベース名を利用した結果の絞り込み

③ 生物種を利用した結果の絞り込み

ファセット…情報の切り口の意味.Sagaceでは, データベースを特徴毎に分類した項目を指す. 何らかの項目の集合があるときに,各項目の それぞれを複数の切り口で分類し,それらの 組み合わせで一つの項目を表現する方法を ファセット分類法(分析合成型分類法)と呼ぶ. この分類法を用いた項目の絞り込み方法を ファセットナビゲーションという. 生物学的な情報は必ずしも階層型構造に入れて 分類できないことも多い.ファセット型分類法は, 検索対象のデータに対して,タグ付のように分類 項目を設定できれば,それらを組み合わせて使える ため,柔軟にデータを分類し,検索結果に活かせる. これらの理由からSagaceでは,ファセットを 使用している.

データベース分類

② データベース分類を 利用した結果の絞り込み

スニペット…情報の断片の意味.検索においては 検索結果の説明文を指す. リッチスニペット…検索結果の付加情報のこと. 検索結果には通常,タイトル,URL,スニペットなどが含まれる.Sagaceが検索対象としているデータベースのエントリーには説明文が書いて いないことが多く,また書いてある場合でも それが自分の目的のものかを判断することが難しい 場合が多くある.そこで,タイトルとスニペットに加え,Sagaceではそれ以外のメタデータを検索 結果に付与している.この付加情報を Sagaceではリッチスニペットと呼んでいる (Google Rich Snippetsに倣っています).

用語解説&ここがポイント!−その3

メタデータ…データ自身に関する 情報を持ったデータ.Sagaceでは, メタデータを利用することで検索結果の 可読性の向上につとめている.

用語解説&ここがポイント!−その1

用語解説&ここがポイント!−その2

Licensed under a Creative Commons表示2.1日本 license (c)2012 伊藤真和吏(独立行政法人 医薬基盤研究所)