Lock in $30 Savings on PRO—Offer Ends Soon! ⏳

20191209_MJIR2019研究発表.pdf

Masao Mori
December 09, 2019

 20191209_MJIR2019研究発表.pdf

 IRへの活用を目的とした大学学内の情報収集は,IR担当者が最初に直面する困難とされている.この課題は,日本にIRが紹介された2006年あたりから今日まで,継続的に指摘されているにも関わらず,一般的な解決が未だ見られないようである.原因として,組織論的な要素と技術的な要素の2つに分類できるが,後者の技術的な要素の中にも大学が抱える組織論的な問題が見受けられる.この考察では,情報収集における技術的な課題の中に見られる大学組織特有の事情について報告し,その解決策の一つを提示する

Masao Mori

December 09, 2019
Tweet

More Decks by Masao Mori

Other Decks in Technology

Transcript

  1. 2

  2. 3 データが集まらない 使い物にならない 人 P 起 因 • 決められた業務を進めるこ とだけを重視し、活用の観

    点がない。 • そもそも業務データで分析 するという概念がない。 • 業務の方法を変えたくなくて、 ファイルや紙で情報を管理し ている。 • コードやIDを使わず、氏名や 組織名で分類している。 技 術 P 起 因 • データベース化するという 概念がなくPCにファイルとし て保管している。 • データベースがあっても、技 術情報を管理していないた め、中身を把握できず活用 ができない。 データが集まらない・使えない理由(例) 今日の話は主にここ
  3. 4 Howard-McLaughlinの 情報支援サイクル 大学執行部 事務局 Institutional Research R.D Howard著, 大学評価・学位授与機構IR研究会訳

    「IR実践ハンドブック」2012 Institutional Research って... 機関の意思決定や計画策定での「判断」を支援するために準備される調査 および分析(Saupe 1990) IRが担う情報 関連業務 実はここがしっかり していないとダメ
  4. 5 We faced to a problem that … Ø 大学職員のみが学内の業務システムの管理・運営

    に携わっている。 Ø 大学職員は情報のスペシャリストとは限らない。 Ø 業務システムの更新・改修が情報のスペシャリスト なしで行われている。 Ø 業務システムの更新・改修後にIRシステムとの連携 が取れない、データのミスマッチが起こるなどのトラブ ルが起こっている。 Ø 情報のスペシャリストがいなくても、更新・改修時に 技術情報が損なわれないようなツールキットが欲しい。 Ø 大学の業務システムとIRシステムの連携を維持する ための技術情報維持ツールキット(meta data description sheet)を提案したい。
  5. 6 FIS 教員自己点検 システム DW データウェアハウス 情報活用IR室 研究費 DB ETL

    データ クレンジング 学内で教職員 が閲覧 教員の自己点検と評価 東工大ポータル DAS IR関連業務 従事者への データアクセ スサービス の提供 Tokyo Tech IR information logistics 人事給与 DB 教務 システム 事 務 局 担 当 者 データは事務局担当者の 目を通ったものをIRデータ としている T2R2 STAR Search フロー、ポリシー、サービスが混在す る。活用の観点からシステムやデー タが従うべきルールが不明瞭。 兼業 データ
  6. 9 FAIR原則(FAIR data principle) • オープンサイエンス推進の世界的潮流 • 科学研究データは、長期的に適切なデータ管理を行う必要がある。 • 近年欧州では科学研究データの扱い方についてFAIR原則ガイドラインで推

    奨されている • オープンサイエンスの推進と研究データの適切な公開方法が記述された データ共有指針。 • 歴史 • 2011年に出版社、図書館、大学等が参加するコミュニティFORCE11で議論 • 2016年にガイドラインを公表。 • ECがFAIR原則を研究データ公開基準とした。 • IR情報との関連 • 2018年、euroCRIS(研究情報管理をサポートする実務者会議)も、IR情報など 機関組織情報にも、FAIR原則が必要と宣言。 • 東工大IRはFAIR原則を活用して、IR情報のロジスティクスを構築中。
  7. 10 Findability 発見可能性 一意かつ継続的な 識別子 メタ情報が豊富 検索可能なリソー スへの登録 メタ情報は識別子 を説明している

    Accessibility 到達可能性 標準的な通信方法 と一意的識別子で 情報が取得可能 そ の 通 信 方 法 は 公開され自由に実 装可能 必 要 が あ れ ば 通 信方法は認証を許 す 本情報が失われて もメタ情報は有効 Interoperability 相互互換性 (メタ)情報は形式 的で広く利用され る言語で記載 (メタ)情報はFAIR 規則に従う (メタ)情報は他の (メタ)情報へ規定 的引用を含む Re-usability 再利用可能性 (メタ)情報は正確 かつ妥当な属性を 持つ (メタ)情報は明確 で利用可能なライ センスを持つ (メタ)情報は出自 を持つ (メタ)情報は分野 で妥当な基準を満 たす FAIR原則 学術研究における情報 共有などを目的にした 連携団体FORCE11によ る調整・提唱
  8. 11 '"*3ݪଇͷϙΠϯτ 1. 分析に必要なデータがどこに、どのよう な形式で存在し、その内容が明確に把握 できるか。 2. 関連するデータは紐付けできるようにID が付されているか、IDの管理は永続的に であるか。

    3. 必要なデータを適切な時期に、IR担当者 が取得できるような配慮がなされている か。 4. IR担当者が取得したデータは、適切なセ キュリティのもとで補完される環境がある か。 メタデータ PID 権限 セキュリティ
  9. 14    FCELV-/ ›5x(47(6 +.·šg#.FCELV.W>H.·š-s47(6 FCELV/·šg.N@CELV-9<A@)6. QCFC8´ (6–’/6

    QCFC.QYEIY@.µ˜^/È QCFC/‰Å¥‘,UB@* (¹²6/;YFD<@o7(6* ‰¬Z QCFC/FC·šg 8k (6* ‰¬Z QCFC/ºŸo7$j€MXG>V)·šg -35ca)6* MXG>V/tm7(5¦™)z§¦nÁ)6* ‰¬Z MXG>V/¢y,b_-Œ2§œ¨dl8Ž¯)6* Œ.a~s{7(6,4Œ-i"6µ˜^/È FCƒsu¥‘-,&$* (1QCFC-/9<A@)6* QCFC8Ã $–’/vi.+-6. QCFC.´/°ž8…&(,7(6, QCFC.p¶‡/+ vi/#.QCFC)s476s«.e©8 (6 QCFC)s476s«¡.ªr^/%7 QCFC/¾.QCFC-¼ $£‹„8±0* QCFC/¢y-¤!(‚s8],&(6 QCFC/ˆ.—,iqÂ|81*-´76* QCFC/k—)9<A@¥‘,FC”sT;AY@8…'* QCFC-i"6¼“,T;AY@ªr/,7(6 QCFC/ÆÀ,[Ç8•"6* QCFC/+.\}[email protected].)6­Ä)6 QCFC/`h*..>ORJE:ŠŸ8¸$ (6* ‰¬Z QCFC/=XKV)SJ<)½~f,·šg 8…'* FC/ `,QCFC8…'* QCFC/e³f'¥®)5•7$¼s¥‘,†«8”* QCFC/  w¿-»«É8”* 業務システムのFAIR原則チェックリスト
  10. 15 データベースの構造記述 15 GPA 学科コード(FK) 学籍番号(FK) ゼメスター(FK) 学籍番号 氏名 学生類別

    学科コード 学科 ゼメスター 年度 期 各ゼメスター毎の学生の 平均GPAデータから所属やゼメスターごとに 学生のGPAの分布を見る多次元分析をおこなう。まずはER図を作成。 学部コード(FK) 学部 学部コード 学生GPA 学籍 学科マスタ ゼメスタマスタ 学部マスタ データベースの構成はER図で
  11. 16 16 GPA 学科コード(FK) 学籍番号(FK) ゼメスター(FK) 学籍番号 学生種別 学科コード 学科

    ゼメスター 年度 期 学部 学生GPA 学籍 学部学科 ゼメスタ データウェアハウスの構成 事実表 Fact Table 次元表 Dimension Table 次元表 Dimension Table 次元表 Dimension Table 事実表を中心に星のような 形をしている “スタースキーマ” DWの構成要素
  12. 17 • メタデータとテーブルの 関係を示したER図、活用 レイヤーでのスタース キーマ、多次元キューブ の構成例を1シートに記 録。 • IR分析のテーマごとに、

    メタデータシートを作成。 • システムの改修などに 応じて、内容を改定。 • 技術を持たない担当者 は、業者に依頼してこの 文書をメンテナンスする。 メタデータの管理方法
  13. 19 Ç Ç É È 維 持 管 理 É

    IR 担 当 Ê 行 Ì
  14. 20 1. データ収集の困難の分類 • 4つの原因 • 「使い物にならない」データの「技術的な」原因 2. ツールキット •

    FAIR原則のチェックリスト(再利用可能性の担保) • 技術情報維持ツールキット “Meta Data Description Sheet” まとめ