Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
オープンな知識グラフWikidataを利用したアプリ開発例
Search
Kouji Kozaki
February 26, 2024
Technology
1
34
オープンな知識グラフWikidataを利用したアプリ開発例
自分の活動に活かすオープンデータ勉強会(2024/2/23)
にて使用した発表スライドです.
Wikidataを用いた開発したアプリの例を紹介しています.
Kouji Kozaki
February 26, 2024
Tweet
Share
More Decks by Kouji Kozaki
See All by Kouji Kozaki
生成AIと知識グラフの相互利用に基づく文書解析
koujikozaki
1
250
ナレッジグラフとLLMの相互利用
koujikozaki
2
970
Other Decks in Technology
See All in Technology
複雑性の高いオブジェクト編集に向き合う: プラガブルなReactフォーム設計
righttouch
PRO
0
110
私なりのAIのご紹介 [2024年版]
qt_luigi
1
120
Amazon SageMaker Unified Studio(Preview)、Lakehouse と Amazon S3 Tables
ishikawa_satoru
0
150
KubeCon NA 2024 Recap / Running WebAssembly (Wasm) Workloads Side-by-Side with Container Workloads
z63d
1
240
kargoの魅力について伝える
magisystem0408
0
200
どちらを使う?GitHub or Azure DevOps Ver. 24H2
kkamegawa
0
620
[Ruby] Develop a Morse Code Learning Gem & Beep from Strings
oguressive
1
150
Oracle Cloud Infrastructure:2024年12月度サービス・アップデート
oracle4engineer
PRO
0
160
Wvlet: A New Flow-Style Query Language For Functional Data Modeling and Interactive Data Analysis - Trino Summit 2024
xerial
1
110
フロントエンド設計にモブ設計を導入してみた / 20241212_cloudsign_TechFrontMeetup
bengo4com
0
1.9k
LINE Developersプロダクト(LIFF/LINE Login)におけるフロントエンド開発
lycorptech_jp
PRO
0
120
Amazon VPC Lattice 最新アップデート紹介 - PrivateLink も似たようなアップデートあったけど違いとは
bigmuramura
0
190
Featured
See All Featured
How STYLIGHT went responsive
nonsquared
95
5.2k
Unsuck your backbone
ammeep
669
57k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
26
1.5k
The MySQL Ecosystem @ GitHub 2015
samlambert
250
12k
Building Your Own Lightsaber
phodgson
103
6.1k
Docker and Python
trallard
41
3.1k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
111
49k
Building Better People: How to give real-time feedback that sticks.
wjessup
365
19k
The Cost Of JavaScript in 2023
addyosmani
45
7k
A Modern Web Designer's Workflow
chriscoyier
693
190k
Building Adaptive Systems
keathley
38
2.3k
A better future with KSS
kneath
238
17k
Transcript
オープンな知識グラフWikidataを 利用したアプリ開発例 大阪電気通信大学 古崎 晃司 自分の活動に活かすオープンデータ勉強会 2024/2/23 2024/2/23 1
Wikidata • ウィキメディア財団が運営する Wikipediaの「データ版」 • 現在,約1億項目 • Wikipediaと同じようにデータをコミュ ニティで編集,公開できる •
API(SPARQLエンドポイント)や各種検 索ツールなども提供 • オープンな知識グラフ(=LOD;Linked Open Data)として利用可 http://wikidata.org/ (ウィキデータ) 参考 英語版Wikipedia 670万記事 日本語版Wikipedia 140万記事 日本国語大辞典 50万項目 ★ 2 2024/2/23
ウィキデータの特徴 ウィキデータは、自由・共同作業・多言語・二次情報を 特徴とする、構造化データのデータベースです。 収集された構造化データは、ウィキペディア、ウィキメ ディア・コモンズや、その他のウィキメディアのプロジェク トで活用されているほか、世界中の誰でも利用できます。 https://www.wikidata.org/wiki/Wikidata:Introduction/ja より
ウィキデータに登録したデータ(知識)は, そのまま,すぐに,オープンデータとして, 「全世界」に公開される! 2024/2/23 3
WikipediaからWikidataへ Wikipediaの各記事から 対応する Wikidata項目へのリンク 4 2024/2/23
Wikidataのデータ例(1/3) Wikidataにおいて 「大阪電気通信大学(Q7105556)」にアクセスした例 https://www.wikidata.org/wiki/Q7105556 さまざまな言語での 「ラベル」,「概要説明」,「別名」 Wikidata上のID :Q****の形式ですべてのデータIDが付けられている 5 2024/2/23
Wikidataのデータ例(2/2) 6 述 語 (プ ロ パ テ ィ )
目 的 語 (オ ブ ジ ェ ク ト ) 他のリソース へのリンク 2024/2/23
IRIによるLODへのアクセス例 7 http://www.wikidata.org/entity/Q7105556.ttl とすると,Turtle形式でデータ取得が可 (Wikidataは,ほかに,.rdf,.nt,.json等に対応) 2024/2/23
Wikidataのおススメポイント 知識/データの量と質 すべてのデータはクリエイティブ・コモンズ CC0 ラ イセンスの下で利用可 登録項目数:108,595,026
(2024/2/23時点) Wikipediaと同様のエディタチェックに基づいた, 登録ユーザによる共同編集 データの入力統制によるクオリティコントロール 検索用API/GUI 使いやすい検索サービス 検索結果の可視化,他サイトへの埋め込みにも対応 APIの提供(SPARQL,Wikipedia API) 2024/2/23 8
Wikidataクエリサービスを用いた SPARQL検索結果の可視化 Wikidataクエリサービスを利用すると, SPARQL検索結果を,データの種類に応じて 可視化することができる. 2024/2/23 9
WikidataのSPARQLエンドポイント ここに,クエリを入れる ・ブラウザからのアクセス https://query.wikidata.org/ ・プログラムからのアクセス https://query.wikidata.org/sparql クエリ結果の表示 10 2024/2/23
可視化例:Timeline https://w.wiki/4ou 検索例3-3-a 「日本にある大学の一覧」を 「設立日」 2024/2/23 11
可視化例:Bar chart https://w.wiki/65ZN select ?s ?sLabel ?o where { ?s
wdt:P31 wd:Q3918 . # ?Sの「分類」が「大学」 ?s wdt:P17 wd:Q17 . # ?sの「国」が「日本」 ?s wdt:P2196 ?o . # ?sの「学生数」を?oとする SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],ja". } }ORDER BY DESC(?o) # DESC(?o)とする「降順」に LIMIT 100 他のグラフ(Chart) も試してみる ここの述語 を変更 2024/2/23 12
可視化例:Map https://w.wiki/65ZP select ?s ?sLabel ?o where { ?s wdt:P31
wd:Q3918 . # ?Sの「分類」が「大学」 ?s wdt:P17 wd:Q17 . # ?sの「国」が「日本」 ?s wdt:P625 ?o . # ?sの「位置座標」を?oとする SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],ja". } } ここの述語 を変更 2024/2/23 13
可視化例:Image gird https://w.wiki/65ZU select ?s ?sLabel ?o where { ?s
wdt:P31 wd:Q3918 . # ?Sの「分類」が「大学」 ?s wdt:P17 wd:Q17 . # ?sの「国」が「日本」 ?s wdt:P18 ?o . # ?sの「画像」を?oとする SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],ja". } } ここの述語 を変更 2024/2/23 14
Wikidataを利用した アプリの開発例 WikidataクエリサービスのAPIなど利用す ることで,様々なアプリの開発が可能 主に研究室の学生が開発したアプリの例 を紹介します 2024/2/23 15
Wikidataを使った検索ツール 開発用のライブラリ 2024/2/23 16 KGSearchForWD(https://kgs.hozo.jp/) Wikidataを使った「知識グラフ検索ツール」開発用のJavaScriptライブラリ Wikidataを使った検索サイトがノーコードで作成可能
Wikidataを用いた エンティティ・リンキング 2024/2/23 17 LODチャレンジ2022 データ活用部門「優秀賞」を受賞 https://shunafuku.github.io/entity- lnking-by-wikidata/ 入力したテキストを解析して Wikidataへのリンクを付与
(エンティティ・リンキング)する
Wikidataによるクイズ生成 2024/2/23 18 https://hozo.jp/opc/ ・Wikidataを使って「2択クイズ」を自動生成 ・テンプレートとなる「SPARQLクエリ」を変える と様々なジャンルのクイズが生成できる LODチャレンジ2023 データ活用部門「優秀賞」を受賞
Wikdiataを用いた動物検索 2024/2/23 19 https://oecu-kozaki-lab.github.io/animalpages/animals.html 「Wikidataの各データから外部DBへのリンク」を 利用して,動物に関する複数のDBを横断検索
まとめ Wikidataはオープンな知識グラフ (=LOD;Linked Open Data)として活用可 すでに多くのデータが公開されているので, プロトタイプ開発にも有効
足りないデータを追加し,オープンデータとして 公開することも可能 他のオープンデータとの連携にも有用 2024/2/23 20 皆さんも,Wikidataを使ってみませんか?