Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ドキュメントの翻訳に必要なこと
Search
Mayuko Sawai
May 15, 2022
Technology
0
860
ドキュメントの翻訳に必要なこと
LINE Technical Writing Meetup vol.13 (2022/5/12)での発表資料です。
Mayuko Sawai
May 15, 2022
Tweet
Share
More Decks by Mayuko Sawai
See All by Mayuko Sawai
テクニカルライターに必要な知識を学べる大学院の紹介/Introduction Master TCLoc
mayukosawai
2
990
Other Decks in Technology
See All in Technology
How Fast Is Fast Enough? [PerfNow 2025]
tammyeverts
2
160
webpack依存からの脱却!快適フロントエンド開発をViteで実現する #vuefes
bengo4com
4
3.8k
「タコピーの原罪」から学ぶ間違った”支援” / the bad support of Takopii
piyonakajima
0
150
JAWS UG AI/ML #32 Amazon BedrockモデルのライフサイクルとEOL対応/How Amazon Bedrock Model Lifecycle Works
quiver
1
130
オブザーバビリティと育てた ID管理・認証認可基盤の歩み / The Journey of an ID Management, Authentication, and Authorization Platform Nurtured with Observability
kaminashi
2
1.3k
AWSが好きすぎて、41歳でエンジニアになり、AAIを経由してAWSパートナー企業に入った話
yama3133
2
200
ViteとTypeScriptのProject Referencesで 大規模モノレポのUIカタログのリリースサイクルを高速化する
shuta13
3
230
AIエージェントによる業務効率化への飽くなき挑戦-AWS上の実開発事例から学んだ効果、現実そしてギャップ-
nasuvitz
5
1.5k
AIでデータ活用を加速させる取り組み / Leveraging AI to accelerate data utilization
okiyuki99
6
1.4k
From Natural Language to K8s Operations: The MCP Architecture and Practice of kubectl-ai
appleboy
0
380
[re:Inent2025事前勉強会(有志で開催)] re:Inventで見つけた人生をちょっと変えるコツ
sh_fk2
1
980
Open Table Format (OTF) が必要になった背景とその機能 (2025.10.28)
simosako
2
490
Featured
See All Featured
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
230
22k
Designing Experiences People Love
moore
142
24k
Writing Fast Ruby
sferik
630
62k
Measuring & Analyzing Core Web Vitals
bluesmoon
9
640
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
253
22k
Into the Great Unknown - MozCon
thekraken
40
2.1k
Java REST API Framework Comparison - PWX 2021
mraible
34
8.9k
The Straight Up "How To Draw Better" Workshop
denniskardys
239
140k
It's Worth the Effort
3n
187
28k
The Invisible Side of Design
smashingmag
302
51k
Code Review Best Practice
trishagee
72
19k
Optimizing for Happiness
mojombo
379
70k
Transcript
1 ドキュメントの翻訳に 必要なこと 澤井 真佑子 Technical Writer, CircleCI
2 本日の発表 • このような方向け ◦ ドキュメントの翻訳を他の会社はどうやっているのか聞 いてみたい ◦ どんな準備やツールが必要か知りたい
3 • ドキュメントサイトの翻訳をどの ように行っているか? • 翻訳に使われるCATツール、翻 訳メモリや用語集の扱い方 など お話しする内容
4 自己紹介 • 名前:澤井 真佑子 / Mayuko Sawai Technical Writer
@ CircleCI (2021.12 〜) • 経歴 ◦ 前職はサイボウズのテクニカルライター • ストラスブール大学のオンライン修士課程で Technical communication & Localization を 勉強中 (LINE TWM vol.7 で紹介) 「テクニカルライターが働きながら学ぶ大学院を紹介します」 https://blog.cybozu.io/entry/2021/09/10/084825
5 CircleCIの紹介
6 CircleCIの概要
7 Continuous Integration(継続的インテグレーション) • コードの変更を迅速かつ安全に マージできる ◦ ビルド ◦ コード解析
◦ 自動化されたテスト ◦ 脆弱性チェック • 効果 ◦ 手戻りの防止 ◦ リリース品質の向上 ◦ 長期的なコスト削減
8 Continuous Deployment(継続的デプロイメント) • コードの変更を迅速かつ 安全に展開・配信する • 効果 ◦ 人手によるミスの防止
◦ 素早いユーザーへの 価値提供
9 Free プランでも十分なビルド時間で自動化可能 Free プランでも 十分なビルド時間で自動化可能 ・毎月6,000分相当のクレジッ トを付与、最適なリソース クラス (CPU/RAM)
を選択可能 ・ユーザー数は無制限 だから チーム開発にも適用可能 ・パワフルなリソースクラス 、 Docker コンテナやVM(Linux, Windows, Mac)を利用可能 同じ時間枠でも CircleCI なら 利用可能な機能がこんなにも ・スピードとパフォーマンスが 向上、Docker コンテナを最適化 ・ビルドがより高速化 、 同時に30並列実行まで可能 ・プライベート Orb で CI/CD も コラボレーション 、設定の 部品化、組織内での再利用可能 ・ビルド時間は約2倍 、自動化 の結果をより早く得られます フィードバックループを回し ソフトウェアを素早く届ける ・ビルド時間を短縮可能 なのは ジョブを並列実行できるから ・インテリジェントにテスト 分割した上で並列実行可能 (ファイル数、ファイルサイズ、 ログからの実行時間実績で分割 ) ・インサイト機能で失敗しがち なテストや結果が不安定なテス トなどを抽出可能 ユーザー登録: https://circleci.com/ja/signup/ 料金プラン: https://circleci.com/ja/pricing/ サポート: https://support.circleci.com/hc/ja
10 CircleCIのドキュメント
11 CircleCI ドキュメントの特徴 • オープンソース ◦ テクニカルライターだけでなく、エンジニアも書く ◦ 社内外からプルリクエストが来る •
更新頻度が高い(毎日どこかのページが変更されている) • 翻訳版は現在のところ日本語のみ
12 私の担当範囲 • CircleCI ドキュメント ◦ 日本語翻訳のマネジメント (社内外の翻訳者とやり取り) ◦ 用語集の作成、更新
◦ スタイルガイド作成、更新 ◦ 品質チェック • changelog (リリースノート)、discuss (掲示 板)、ブログ、プロモーションページなどの翻訳 管理も担当
13 ここからは、ドキュメント翻訳をどのように行っているか、 まず基盤の面から紹介していきます。
14 CircleCI ドキュメントの基盤(GitHub)と 翻訳システム(CAT tool) GitHub 記事ファイル テクニカル ライター 社内コントリ
ビューター 社外コントリビュー ター CAT Tool 翻訳メモリー 翻訳者 翻訳者 En Ja ① 記事をプッシュ ② 定期的にSync ③ 原文の変更箇所 だけを翻訳 ④ 翻訳結果をプッシュ CAT: Computer-aided translation
15 こちら側は知ってる人が多いと思います GitHub 記事ファイル テクニカル ライター 社内コントリ ビューター 社外コントリビュー ター
CAT Tool 翻訳メモリー 翻訳者 翻訳者 En Ja ① 記事をプッシュ ② 定期的にSync ③ 原文の変更箇所 だけを翻訳 ④ 翻訳結果をプッシュ
16 今日はCATツールの仕組みや使い方を紹介します GitHub 記事ファイル テクニカル ライター 社内コントリ ビューター 社外コントリビュー ター
CAT Tool 翻訳メモリー 翻訳者 翻訳者 En Ja ① 記事をプッシュ ② 定期的にSync ③ 原文の変更箇所 だけを翻訳 ④ 翻訳結果をプッシュ CAT: Computer-aided translation
17 CATツールとは 翻訳メモリ、用語集などの構成要素について
18 CAT (Computer-aided-translation) は、人間の翻訳をコンピューターが支援 するツール • さまざまなファイル形式を同一のシステム上で扱うことができる • 翻訳メモリ (TM)、用語集、機械翻訳、QAなどの機能
• プロジェクト管理、APIなどの拡張機能を含めて TMS (Translation management system) と呼ばれることもある CATツールとは
19 代表的なTMS https://www.nimdzi.com/the-tms-arena-nimdzi-finger-food/ TMS: Translation Management System. CATツールにプロジェクト管理などの機能が加わったもの
20 文章やパラグラフ単位で過去の翻訳を蓄積したデータベース。 ソース言語とターゲット言語が対になっている。 使われ方 • CATツールで翻訳するとき、翻訳メモリが検索され、同一または 似ている原文に対して翻訳がサジェストされる → 👍 同じ文、似た文を翻訳する手間を省ける
→ 👍 スタイルを統一できる • CATツール上で翻訳すると、自動的に翻訳メモリにデータが 追加・更新される 翻訳メモリとは
21 翻訳料金の計算例 マッチ率 単価 ワード数 金額 100%マッチ ¥5.0 30 ¥150
85-94%マッチ ¥15.0 37 ¥555 75-84%マッチ ¥20.0 96 ¥1,920 50-74%マッチ ¥20.0 700 ¥14,000 ノーマッチ ¥20.0 1250 ¥25,000 • 翻訳メモリがあると、翻訳 コストを下げられる場合が 多い
22 用語集と翻訳メモリはどう違う? • 翻訳メモリだけあれば十分なのでは? • 用語集はどう役に立つの?
23 翻訳エディター画面 (Memsourceの例) https://youtu.be/WHxxxCvNqxo • 「96%マッチ」など、翻訳メモ リとのマッチ率つきで訳文が サジェストされる • 用語集に登録されている語
も、訳語が示される • 機械翻訳の結果を入れるこ ともできる
24 翻訳メモリと用語集 翻訳メモリ • セグメント(文章やパラグラフ)全体にマッチさせ、85% 、50% などの数字を出す • コスト算出に使われる •
翻訳することで自動的にデータが更新される 用語集 • 80%マッチなどの類似度は見ない。(通常1,2語の)単語レベ ルの一致を見る • コスト算出には使われない • 翻訳メモリのように、翻訳すれば自動的に更新されるもので はない • 誰かが新しい用語を提案し、データベースを管理する必要が ある
25 用語集と翻訳メモリ つまり、 • 翻訳メモリは、歴史的な積み上げ • 用語集は、人手で最新に保たれた、その言語を制御する モジュール 翻訳メモリと用語集は、期待される役割が異なり、 組み合わせて使われる。
26 よくある使われ方 • 用語集と翻訳メモリを組み合わせて使い、不一致があれば、用語集を優先 させる ◦ 長年使われている翻訳メモリには「今はもうその言い方はしない」という 翻訳が残っている。用語集は人手で最新に保たれているので、翻訳メ モリとのコンフリクトが起こる。 この場合、用語集に従うべきとする運用が多い。
(そういう使い方をしないなら、翻訳メモリだけでいいという話になる)
27 翻訳メモリの運用Tips • なるべく細かい単位で作っておく ◦ 「ドキュメント」「マーケティングサイト」などのコンテンツ別、部署別など → 👍 これにより、継続的に適切に翻訳メモリが更新される •
read (参照)と write (更新)の設定をうまく使う ◦ マーケティング資料の翻訳では、ドキュメントの翻訳メモリを参照するが、 更新はマーケティングの翻訳メモリのみにする等 • (超基本)使わない翻訳のデータは削除する → 😢 削除しないと、次回以降の翻訳で再び使われる可能性がある
28 用語集の運用Tips • 内容を最新に保つ ◦ 翻訳メモリと違って自動で更新されないので、一度作ってもメンテしないと 全く役に立たなくなる ◦ CircleCI では、社内翻訳者や翻訳会社で用語登録リクエストのスプレッド
シートを共有し、週1回、用語集への追加作業を実施 • 最初は小さく始める ◦ 多すぎてコントロールしにくい状態になるより、不可欠なものだけ少しず つ足していく方が良い • なるべく多くメタデータを付与する ◦ 翻訳者の判断の助けになる
29 用語管理が不十分だとどうなる? • 用語管理は、最初は大 変だが、後になるほど楽 になる ✌ • やらないと、後になるほ ど大変
😱 From: https://www.slideshare.net/akashjd/prof-klaus-terminology-management
30 まとめ • CircleCI ドキュメントの翻訳をどのように行っているか • CATツールとは? • 翻訳メモリ、用語集にはそれぞれどんな役割があるか •
翻訳メモリ、用語集の運用Tips
31 Thank you.