Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
データの考古学もしくは人類学 ~ノーテック企業でデータを扱うこと~
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
データ横丁
January 23, 2026
0
130
データの考古学もしくは人類学 ~ノーテック企業でデータを扱うこと~
遠藤尚也/ノーテック企業でデータのこと全般
データ横丁
January 23, 2026
Tweet
Share
More Decks by データ横丁
See All by データ横丁
第5回 メタデータ通り_オンライン 検討会
datayokocho
0
14
【みずたに】情報とは何か
datayokocho
0
210
データ横丁・新年LT大会:ご発表者、ご参加者へのご案内
datayokocho
0
760
第4回 「メタデータ通り」 リアル開催
datayokocho
0
190
第3回 「メタデータ通り」 Zoom開催
datayokocho
0
24
第2回 メタデータ通り#1Meetup _資料
datayokocho
0
280
データモデリング通り #2オンライン勉強会 ~方法論の話をしよう~
datayokocho
0
410
メタデータ通りの趣旨と進め方
datayokocho
0
410
Featured
See All Featured
Documentation Writing (for coders)
carmenintech
77
5.3k
SERP Conf. Vienna - Web Accessibility: Optimizing for Inclusivity and SEO
sarafernandez
1
1.3k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
162
16k
How to Get Subject Matter Experts Bought In and Actively Contributing to SEO & PR Initiatives.
livdayseo
0
75
Thoughts on Productivity
jonyablonski
75
5.1k
Java REST API Framework Comparison - PWX 2021
mraible
34
9.2k
Everyday Curiosity
cassininazir
0
140
Rails Girls Zürich Keynote
gr2m
96
14k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
666
130k
Principles of Awesome APIs and How to Build Them.
keavy
128
17k
Odyssey Design
rkendrick25
PRO
2
520
Design of three-dimensional binary manipulators for pick-and-place task avoiding obstacles (IECON2024)
konakalab
0
360
Transcript
データの考古学もしくは人類学 ~ノーテック企業でデータを扱うこと~ 遠藤尚也/ノーテック企業でデータのこと全般 データ横丁・新年 LT大会 2026 ~
所属先:某ノーテック企業(エンジニアもデザイナーもいない) 事業内容:医療用機器の輸出入、卸売および販売、研究開発および製造 理化学機器の輸出入、卸売および販売、研究開発および製造 上記機器のメンテナンス業務 美容器具の輸出入、卸売および販売、研究開発および製造 医薬部外品、化粧品の卸売および販売、研究開発および製造 医療用施設内テレビ用コンテンツ配信業務 1/14 データ横丁・新年 LT大会
2026 ~
化石は簡単に嘘をつく 2/14 データ横丁・新年 LT大会 2026 ~
この3体の恐竜の共通点って何だと思いますか? 3/14 データ横丁・新年 LT大会 2026 ~ mesozoniaオリジナルイメージ(https://mesozonia.com/iguanodon-fukugemmisu/)
同じ化石から作られた復元図 4/14 データ横丁・新年 LT大会 2026 ~
「化石は簡単に嘘をつく」理由 ①記録の不完全性:地球上の生物のごく一部しか化石と して残らない。 ②解釈の難しさ:発見された化石の断片から生物全体の 姿や生態を推測するのは容易でない。 ③堆積学的・地質学的プロセス:化石は形成された後、 地殻変動や浸食などによって破壊されたり、元の場所か ら移動したりすることがある。 5/14 データ横丁・新年
LT大会 2026 ~
データも簡単に嘘をつく!? 6/14 データ横丁・新年 LT大会 2026 ~
私の日常 その① 分析するデータがない。 データマイニングする前にデータ自体をマイニングしないといけない。 7/14 データ横丁・新年 LT大会 2026 ~
私の日常 その② 基幹システムからダウンロードしたデータにユニークキー(主キー)がない。 同じ顧客に複数のコードが採番されているし、まとめる親コードもない。 8/14 データ横丁・新年 LT大会 2026 ~ 出庫先コード
出庫先名 SH-33834 (医)◦◦◦皮ふ科CL SH-A4464 (医)◦◦◦皮【XT】 SH-24464 (医)◦◦◦皮ふ科CL 得意先コード 得意先名 T-A4424 ••••皮ふ科【XTRAC】 T-24424 ••••皮ふ科 T-04424 ••••皮ふ科【振替】 ※データはダミーです。
どうなって目の前のようなカタチで残ったのか? ↓ 現在の社内の人間の言動を観察する ↓ データの成り立ちを推測する ↓ 分析に必要な要素を補う 9/14 データ横丁・新年 LT大会
2026 ~
基幹システムのデータを観察して気づいたこと/解決策 ・注文単位での区別がしやすい ・顧客が複数のマスタに紐付いている ・1回の注文では、同じ顧客マスタが使われている ↓ 『注文された製品が指定の場合に届いて請求にまわる』 ことが最優先 ↓ 個々の注文を超えて紐付けるマスタデータの整備が必要 10/14
データ横丁・新年 LT大会 2026 ~
まとめ データのクセは、組織の価値観の写し鏡 ⚫FAXからの入力ミスも、名寄せの放棄も、そのとき に現場が最優先した仕事が作ったカタチ ⚫データの歪みは「欠陥」ではなく、そのデータを生 み出した組織の優先順位の記録 ⚫「正しい」カタチのデータを上書きするのではなく、 “何を守ってきたか”を理解してクリーニングする 11/14 データ横丁・新年
LT大会 2026 ~
データも簡単に嘘をつく? ↓ 私たちの思い込みが騙らせる & データは簡単には語らない 12/14 データ横丁・新年 LT大会 2026 ~
もしもノーテック企業がユーザーになって Garbage のようなデータを in してきても 彼らには悪気も敵意も邪心もありません。 なので使えるデータをすくい取るだけでなく 価値観も汲み取ってもらえるとうれしいです。 13/14 データ横丁・新年
LT大会 2026 ~
Garbage in, garbage out. Yet one person’s garbage is another
person’s GOLD. 14/14 データ横丁・新年 LT大会 2026 ~