Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Open Data from CNS11643
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
趙惟倫
June 27, 2015
How-to & DIY
270
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
Open Data from CNS11643
全字庫開放資料的應用
https://github.com/bluebat/.presentations/raw/master/open-data-from-cns11643.odp
趙惟倫
June 27, 2015
More Decks by 趙惟倫
See All by 趙惟倫
BASH Basics
bluebat
0
110
VDI Historical Overview
bluebat
1
190
RPM Sphere Repository
bluebat
0
1.5k
Multiplication Table in Various Programming Languages
bluebat
0
640
Gamelets Arena for AI Players
bluebat
0
720
Alternative Web Services
bluebat
0
290
Look at Yue Desktop
bluebat
0
530
msgchi L10n Tool
bluebat
0
730
Making P-Font with FontForge
bluebat
0
190
Other Decks in How-to & DIY
See All in How-to & DIY
ドローンをAWSで制御してみた
nagi900
0
150
生成AIは 『コードを書く』だけじゃない アーキテクチャ設計から環境構築まで——社内データ活用DXの全貌
punipuni_mint
0
180
私がカンファレンスのプロポーザルを書くときに考えていること
kotomin_m
1
750
JAWS-UG/AWSコミュニティプログラムのご紹介 (JAWS-UG広島)
awsjcpm
1
150
EmbeddingGemmaをDifyから使いたいけどAPI経由はつまらん #iotlt #gemma #dify
n0bisuke2
0
200
JAWS-UG 福岡 in 北九州 | JAWS-UG/AWSコミュニティ プログラムのご紹介
awsjcpm
1
220
Goカードゲームを 作ってみた!
senoue
0
250
JAWS-UGとAWS - JAWS-UG彩の国埼玉設立のお祝い
awsjcpm
2
710
いしかわ暮らしセミナー~知って安心!移住とお金講座~
matyuda
0
240
登壇資料を素早く作るための順番
kotomin_m
8
2.1k
EjecTea 2026 / 20260228-osc26tk-ejectea
akkiesoft
0
940
5年間ぐらい、 スプリントレトロスペクティブは、 「+/Δ」しかしてないので、 あらためて良いのか悪いか考えてみる / Doing Plus Delta for about five years
camel_404
1
440
Featured
See All Featured
Building Better People: How to give real-time feedback that sticks.
wjessup
370
20k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
35
2.5k
Intergalactic Javascript Robots from Outer Space
tanoku
273
27k
The SEO identity crisis: Don't let AI make you average
varn
0
490
Rebuilding a faster, lazier Slack
samanthasiow
85
9.5k
How Fast Is Fast Enough? [PerfNow 2025]
tammyeverts
3
610
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
49
10k
We Have a Design System, Now What?
morganepeng
55
8.2k
Conquering PDFs: document understanding beyond plain text
inesmontani
PRO
4
2.8k
Building Experiences: Design Systems, User Experience, and Full Site Editing
marktimemedia
0
530
The Power of CSS Pseudo Elements
geoffreycrofte
82
6.3k
Information Architects: The Missing Link in Design Systems
soysaucechin
0
970
Transcript
趙惟倫 <
[email protected]
> 2015 年 6 月 27 日 全字庫開放資料的應用 全字庫開放資料的應用
香港開源年會
書同文 書同文 「今天下車同軌,書同文,行同倫。」 《禮記.中庸》
全字庫 全字庫 計畫網站: http://www.cns11643.gov.tw/ 計畫授權聲明: http://www.cns11643.gov.tw/AIDB/copyright.do 資料開放平臺: http://data.gov.tw/node/5961 使用規範: http://data.gov.tw/?q=principle
「創用 CC 姓名標示」? * * 參考 https://threelegcat.wordpress.com/2015/06/03/
開放資料 開放資料 字型: 全字庫正宋體 全字庫正楷體 屬性資料: 注音、倉頡、筆畫、部首、拼音、部件及筆順 編碼對照表:
五大碼、萬國碼、電信碼、地政自造字、財稅內碼、稅務 碼及工商自造字
使用難處 使用難處 中標碼收錄字元偶有修訂 中標碼為交換碼而非內碼 字型由多次委外製作而成 國際內碼標準不斷更新 公訂屬性資料與民間習慣有差異 民訂屬性資料與民間習慣不相容 表格主鍵為中標碼而非萬國碼
衍生應用 衍生應用 ( ( 字型 字型 ) ) 目前成果:
正宋體原有的 TW-Sung-98_1.ttf, TW-Sung-Ext-B- 98_1.ttf, TW-Sung-Plus-98_1.ttf 加上由 EXTC* 從全字庫 資料庫中整理出的 EXTCMING.ttf 製作 RPM 格式套件: tw-sung-fonts-98.1-2.fc21.src.rpm 正楷體原有的 TW-Kai-98_1.ttf, TW-Kai-Ext-B- 98_1.ttf, TW-Kai-Plus-98_1.ttf 加上由 EXTC* 從全字庫 資料庫中整理出的 EXTCKAI.ttf 製作 RPM 格式套件: tw-kai-fonts-98.1-2.fc21.src.rpm * 參考 http://blog.xuite.net/extensionc/twblog/312593089
衍生應用 衍生應用 ( ( 字型 字型 ) ) 未來計畫:
以工具軟體 FontForge 轉換為 sfdir 文字檔案,做為適合 github 儲存與管理的格式。 將萬國碼表意文字補充平面的部分融合,並修改名稱資料 ,然後匯出為新的字型。
衍生應用 衍生應用 ( ( 屬性資料 屬性資料 ) ) 目前成果:
修改表格的中標碼主鍵以方便交叉參考 交叉參考產生漢語拼音、簡易、筆順等屬性表格 產生可做為輸入法規則的對照表 『書寫筆畫序』屬性修改為『部件筆畫序』 筆畫代碼: 1( 橫筆 ) 、 2( 豎筆 ) 、 3( 撇筆 ) 、 4( 點 筆 ) 、 5( 折筆 ) 之外,加入 0( 空筆 ) 與 6( 圈筆 ) 。
衍生應用 衍生應用 ( ( 屬性資料 屬性資料 ) ) 未來計畫: 從
uni_stroke_sequence.txt 產生 cfs11643_stroke 在 /usr/share/i18n/locales/yue_HK 中插入 然後執行 就可以讓語區 yue_HK 獲得漢字排序的效果 mk-cfs11643_stroke.sh > /usr/share/i18n/locales/cfs11643_stroke LC_COLLATE copy "cfs11643_stroke" END LC_COLLATE LC_COLLATE copy "cfs11643_stroke" END LC_COLLATE localedef -f UTF-8 -i yue_HK yue_HK LANG=yue_HK ls 〇 一 二 三 冇 四 佢 咗 梘 啲 撳 劏 嚟
衍生應用 衍生應用 ( ( 編碼對照表 編碼對照表 ) ) 目前成果:
表格的主鍵由中標碼改為萬國碼 產生可做為輸入法規則的對照表 未來計畫: 交叉參考產生中標碼與國標碼的對照表
應用網址 應用網址 目前成果: https://github.com/bluebat/cfs11643 https://github.com/bluebat/cin-tables https://bluebat.fedorapeople.org/ppa/ 未來計畫: https://github.com/cfs11643
謝謝各位 敬請指教 簡報模板:資訊未來大自由 ( 孫賜萍 )