Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
データの考古学もしくは人類学 ~ノーテック企業でデータを扱うこと~
Search
データ横丁
January 23, 2026
180
0
Share
データの考古学もしくは人類学 ~ノーテック企業でデータを扱うこと~
遠藤尚也/ノーテック企業でデータのこと全般
データ横丁
January 23, 2026
More Decks by データ横丁
See All by データ横丁
第6回(最終回) 「メタデータ通り」 リアル開催
datayokocho
1
140
第5回 メタデータ通り_オンライン 検討会
datayokocho
0
18
【みずたに】情報とは何か
datayokocho
0
250
データ横丁・新年LT大会:ご発表者、ご参加者へのご案内
datayokocho
0
800
第4回 「メタデータ通り」 リアル開催
datayokocho
0
200
第3回 「メタデータ通り」 Zoom開催
datayokocho
0
30
第2回 メタデータ通り#1Meetup _資料
datayokocho
0
280
データモデリング通り #2オンライン勉強会 ~方法論の話をしよう~
datayokocho
0
440
メタデータ通りの趣旨と進め方
datayokocho
0
420
Featured
See All Featured
職位にかかわらず全員がリーダーシップを発揮するチーム作り / Building a team where everyone can demonstrate leadership regardless of position
madoxten
62
53k
SEO in 2025: How to Prepare for the Future of Search
ipullrank
3
3.4k
Unsuck your backbone
ammeep
672
58k
Rebuilding a faster, lazier Slack
samanthasiow
85
9.4k
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
16
1.9k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
249
1.3M
What’s in a name? Adding method to the madness
productmarketing
PRO
24
4k
Conquering PDFs: document understanding beyond plain text
inesmontani
PRO
4
2.6k
The B2B funnel & how to create a winning content strategy
katarinadahlin
PRO
1
320
Being A Developer After 40
akosma
91
590k
Design in an AI World
tapps
0
190
Lightning Talk: Beautiful Slides for Beginners
inesmontani
PRO
1
500
Transcript
データの考古学もしくは人類学 ~ノーテック企業でデータを扱うこと~ 遠藤尚也/ノーテック企業でデータのこと全般 データ横丁・新年 LT大会 2026 ~
所属先:某ノーテック企業(エンジニアもデザイナーもいない) 事業内容:医療用機器の輸出入、卸売および販売、研究開発および製造 理化学機器の輸出入、卸売および販売、研究開発および製造 上記機器のメンテナンス業務 美容器具の輸出入、卸売および販売、研究開発および製造 医薬部外品、化粧品の卸売および販売、研究開発および製造 医療用施設内テレビ用コンテンツ配信業務 1/14 データ横丁・新年 LT大会
2026 ~
化石は簡単に嘘をつく 2/14 データ横丁・新年 LT大会 2026 ~
この3体の恐竜の共通点って何だと思いますか? 3/14 データ横丁・新年 LT大会 2026 ~ mesozoniaオリジナルイメージ(https://mesozonia.com/iguanodon-fukugemmisu/)
同じ化石から作られた復元図 4/14 データ横丁・新年 LT大会 2026 ~
「化石は簡単に嘘をつく」理由 ①記録の不完全性:地球上の生物のごく一部しか化石と して残らない。 ②解釈の難しさ:発見された化石の断片から生物全体の 姿や生態を推測するのは容易でない。 ③堆積学的・地質学的プロセス:化石は形成された後、 地殻変動や浸食などによって破壊されたり、元の場所か ら移動したりすることがある。 5/14 データ横丁・新年
LT大会 2026 ~
データも簡単に嘘をつく!? 6/14 データ横丁・新年 LT大会 2026 ~
私の日常 その① 分析するデータがない。 データマイニングする前にデータ自体をマイニングしないといけない。 7/14 データ横丁・新年 LT大会 2026 ~
私の日常 その② 基幹システムからダウンロードしたデータにユニークキー(主キー)がない。 同じ顧客に複数のコードが採番されているし、まとめる親コードもない。 8/14 データ横丁・新年 LT大会 2026 ~ 出庫先コード
出庫先名 SH-33834 (医)◦◦◦皮ふ科CL SH-A4464 (医)◦◦◦皮【XT】 SH-24464 (医)◦◦◦皮ふ科CL 得意先コード 得意先名 T-A4424 ••••皮ふ科【XTRAC】 T-24424 ••••皮ふ科 T-04424 ••••皮ふ科【振替】 ※データはダミーです。
どうなって目の前のようなカタチで残ったのか? ↓ 現在の社内の人間の言動を観察する ↓ データの成り立ちを推測する ↓ 分析に必要な要素を補う 9/14 データ横丁・新年 LT大会
2026 ~
基幹システムのデータを観察して気づいたこと/解決策 ・注文単位での区別がしやすい ・顧客が複数のマスタに紐付いている ・1回の注文では、同じ顧客マスタが使われている ↓ 『注文された製品が指定の場合に届いて請求にまわる』 ことが最優先 ↓ 個々の注文を超えて紐付けるマスタデータの整備が必要 10/14
データ横丁・新年 LT大会 2026 ~
まとめ データのクセは、組織の価値観の写し鏡 ⚫FAXからの入力ミスも、名寄せの放棄も、そのとき に現場が最優先した仕事が作ったカタチ ⚫データの歪みは「欠陥」ではなく、そのデータを生 み出した組織の優先順位の記録 ⚫「正しい」カタチのデータを上書きするのではなく、 “何を守ってきたか”を理解してクリーニングする 11/14 データ横丁・新年
LT大会 2026 ~
データも簡単に嘘をつく? ↓ 私たちの思い込みが騙らせる & データは簡単には語らない 12/14 データ横丁・新年 LT大会 2026 ~
もしもノーテック企業がユーザーになって Garbage のようなデータを in してきても 彼らには悪気も敵意も邪心もありません。 なので使えるデータをすくい取るだけでなく 価値観も汲み取ってもらえるとうれしいです。 13/14 データ横丁・新年
LT大会 2026 ~
Garbage in, garbage out. Yet one person’s garbage is another
person’s GOLD. 14/14 データ横丁・新年 LT大会 2026 ~