Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
データハンドリング/data_handling
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
florets1
July 11, 2024
Education
280
2
Share
データハンドリング/data_handling
florets1
July 11, 2024
More Decks by florets1
See All by florets1
データ分析をはじめよう/lets_start_data_analysis
florets1
0
1
なぜSQLはAIぽく見えるのか/why does SQL look AI like
florets1
0
600
Tableauとggplot2の背景/Background_of_Tableau_and_ggplot2
florets1
0
71
Rで学ぶデータハンドリング入門/Introduction_to_Data_Handling_with_R
florets1
0
140
人工知能はクロスジョインでできている/AI_Is_Built_on_Cross_Joins
florets1
0
100
仮説の取扱説明書/User_Guide_to_a_Hypothesis
florets1
4
460
複式簿記から純資産を排除する/eliminate_net_assets_from_double-entry_bookkeeping
florets1
1
470
カイ二乗検定は何をやっているのか/What_Does_the_Chi-Square_Test_Do
florets1
7
2.5k
直積は便利/direct_product_is_useful
florets1
3
470
Other Decks in Education
See All in Education
SSH公開鍵認証 / 02-b-ssh
kaityo256
PRO
0
140
Virtual and Augmented Reality - Lecture 8 - Next Generation User Interfaces (4018166FNR)
signer
PRO
0
2.1k
Data Representation - Lecture 3 - Information Visualisation (4019538FNR)
signer
PRO
1
2.9k
(2026) Quelle(s) mathématique(s) dans la "grande" culture?
mansuy
1
100
地区危機管理委員会 出前セミナー「ロータリーにおける危機管理」:膳所 和彦 氏(国際ロータリー第2720地区 パストガバナー・日田ロータリークラブ・医療法人恒心会ぜぜ医院 理事長):2720 Japan O.K. ロータリーEクラブ2026年2月16日卓話
2720japanoke
1
620
Sponsorship 2026 | VizChitra
vizchitra
2
180
バージョン管理とは / 01-a-vcs
kaityo256
PRO
1
280
SSH_handshake_easy_explain
kenbo
0
960
What workforce agencies must have in place to compete for and deliver on RESTART grants
territorium
PRO
0
130
Gitの中身 / 03-a-git-internals
kaityo256
PRO
0
170
Google Antigravity エージェント・フ ァーストな開発パラダイムへの招待
mickey_kubo
1
120
応募課題(’25広島)
forget1900
0
990
Featured
See All Featured
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
10
1.1k
Optimizing for Happiness
mojombo
378
71k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
31
10k
Building Experiences: Design Systems, User Experience, and Full Site Editing
marktimemedia
0
480
Agile Actions for Facilitating Distributed Teams - ADO2019
mkilby
0
170
What's in a price? How to price your products and services
michaelherold
247
13k
Mobile First: as difficult as doing things right
swwweet
225
10k
Designing for Performance
lara
611
70k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
133
19k
Visualization
eitanlees
150
17k
Have SEOs Ruined the Internet? - User Awareness of SEO in 2025
akashhashmi
0
310
[SF Ruby Conf 2025] Rails X
palkan
2
930
Transcript
1 2024.07.13 Tokyo.R #114 データハンドリング
2 応募者の選考データ 雑然データ.csv 整然データ.csv
3 整然データは扱いやすい(1)
4 整然データは扱いやすい(2)
5 整然データは扱いやすい(3)
6 整然データは扱いやすい(4)
7 整然データは扱いやすい(5) いいところ:選考段階が三次、四次と増えてもコード変更なしで通過率を求めることができる
8 雑然データは扱いにくい(1)
9 雑然データは扱いにくい(2)
10 雑然データは扱いにくい(3) つらいところ:選考段階が増えるごとにコード変更が必要
11 雑然データを整然データに変換 整然データ.csv 雑然データ.csv pivot_longer
12 変換できたら後は同じ
13 整然データの定義(1) 1.個々の変数が1つの列をなす。 2.個々の観測が1つの行をなす。 3.個々の観測の構成単位の類型が1つの表をなす。 4.個々の値が1つのセルをなす。
14 整然データの定義(2) 1.個々の変数が1つの列をなす。 2.個々の観測が1つの行をなす。 3.個々の観測の構成単位の類型が1つの表をなす。 4.個々の値が1つのセルをなす。 定義を満たしていない 変数が1つの列をなしていない
15 整然データの定義(3) 1.個々の変数が1つの列をなす。 2.個々の観測が1つの行をなす。 3.個々の観測の構成単位の類型が1つの表をなす。 4.個々の値が1つのセルをなす。 定義を満たしていない 応募者NO.1、選考段階「一次」の観測で1行 応募者NO.1、選考段階「二次」の観測で1行 となってほしい
16 整然データの定義(4) 1.個々の変数が1つの列をなす。 2.個々の観測が1つの行をなす。 3.個々の観測の構成単位の類型が1つの表をなす。 4.個々の値が1つのセルをなす。 定義を満たしている
17 整然データの定義(5) 1.個々の変数が1つの列をなす。 2.個々の観測が1つの行をなす。 3.個々の観測の構成単位の類型が1つの表をなす。 4.個々の値が1つのセルをなす。 分ける ・一つの事実は一つの場所へ ・矛盾した登録を防げる
18 整然データの定義(6) 1.個々の変数が1つの列をなす。 2.個々の観測が1つの行をなす。 3.個々の観測の構成単位の類型が1つの表をなす。 4.個々の値が1つのセルをなす。 1月応募.csv 2月応募.csv 3月応募.csv つなげる
19 整然データの定義(7) 1.個々の変数が1つの列をなす。 2.個々の観測が1つの行をなす。 3.個々の観測の構成単位の類型が1つの表をなす。 4.個々の値が1つのセルをなす。 定義を満たしていない 1つのセルに複数の値が入っている
20 整然データの定義(8) 1.個々の変数が1つの列をなす。 2.個々の観測が1つの行をなす。 3.個々の観測の構成単位の類型が1つの表をなす。 4.個々の値が1つのセルをなす。 分ける
雑然データに気を付けて データハンドリングが難しいなあ と感じたら、それは 雑然データかもしれません。 雑然データのままがんばるのではなく 整然データに変換できないか 検討してみましょう。