Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ドキュメントの翻訳に必要なこと
Search
Mayuko Sawai
May 15, 2022
Technology
900
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
ドキュメントの翻訳に必要なこと
LINE Technical Writing Meetup vol.13 (2022/5/12)での発表資料です。
Mayuko Sawai
May 15, 2022
More Decks by Mayuko Sawai
See All by Mayuko Sawai
テクニカルライターに必要な知識を学べる大学院の紹介/Introduction Master TCLoc
mayukosawai
2
1.1k
Other Decks in Technology
See All in Technology
「軸足」は 固定しなくていい - 熱量と強みで描く、しなやかなキャリアの形
kakehashi
PRO
1
270
【Snowflake Summit 2026 Recap!!】Snowflake Summit Deep Dive: Security & Governance
civitaspo
1
320
AIチャット検索改善の3週間
kworkdev
PRO
2
190
AI時代に求められる技術力 フロンティア・クリエイティビティ / Technical Excellence in the AI Era: Frontier Creativity
kaonavi
0
120
螺旋型キャリアの生存戦略 / kinoko-conf2026
rakus_dev
1
1.1k
コミュニティの有益性 ~JAWS Days 2026 での体験を通して~ / The Benefits of a Community ~Through My Experience at JAWS Days 2026~
seike460
PRO
0
290
水を運ぶ人としてのリーダーシップ
izumii19
4
1k
スタートアップにAmazon EKSは早すぎる? マルチプロダクト戦略を加速する Platform Engineeringの実践 / Is Amazon EKS Too Soon for Startups? Practical Platform Engineering to Accelerate a Multi-Product Strategy
elmodev09
1
1.9k
[チョークトーク資料]AWS DevOps Agent を使いこなす / AWS Dev Ops Agent Chalk Talk AWS Summit Japan 2026
kinunori
4
790
組織における AI-DLC 実践
askul
0
130
Zenoh on Zephyr on LiteX
takasehideki
2
120
AIペネトレーションテスト・ セキュリティ検証「AgenticSec」紹介資料
laysakura
2
7.7k
Featured
See All Featured
A Guide to Academic Writing Using Generative AI - A Workshop
ks91
PRO
1
340
The B2B funnel & how to create a winning content strategy
katarinadahlin
PRO
1
400
Dominate Local Search Results - an insider guide to GBP, reviews, and Local SEO
greggifford
PRO
0
200
Six Lessons from altMBA
skipperchong
29
4.3k
Ecommerce SEO: The Keys for Success Now & Beyond - #SERPConf2024
aleyda
1
2k
Why Our Code Smells
bkeepers
PRO
340
58k
The Limits of Empathy - UXLibs8
cassininazir
1
370
Self-Hosted WebAssembly Runtime for Runtime-Neutral Checkpoint/Restore in Edge–Cloud Continuum
chikuwait
0
620
Abbi's Birthday
coloredviolet
3
8.2k
Connecting the Dots Between Site Speed, User Experience & Your Business [WebExpo 2025]
tammyeverts
11
950
Leadership Guide Workshop - DevTernity 2021
reverentgeek
1
310
KATA
mclloyd
PRO
35
15k
Transcript
1 ドキュメントの翻訳に 必要なこと 澤井 真佑子 Technical Writer, CircleCI
2 本日の発表 • このような方向け ◦ ドキュメントの翻訳を他の会社はどうやっているのか聞 いてみたい ◦ どんな準備やツールが必要か知りたい
3 • ドキュメントサイトの翻訳をどの ように行っているか? • 翻訳に使われるCATツール、翻 訳メモリや用語集の扱い方 など お話しする内容
4 自己紹介 • 名前:澤井 真佑子 / Mayuko Sawai Technical Writer
@ CircleCI (2021.12 〜) • 経歴 ◦ 前職はサイボウズのテクニカルライター • ストラスブール大学のオンライン修士課程で Technical communication & Localization を 勉強中 (LINE TWM vol.7 で紹介) 「テクニカルライターが働きながら学ぶ大学院を紹介します」 https://blog.cybozu.io/entry/2021/09/10/084825
5 CircleCIの紹介
6 CircleCIの概要
7 Continuous Integration(継続的インテグレーション) • コードの変更を迅速かつ安全に マージできる ◦ ビルド ◦ コード解析
◦ 自動化されたテスト ◦ 脆弱性チェック • 効果 ◦ 手戻りの防止 ◦ リリース品質の向上 ◦ 長期的なコスト削減
8 Continuous Deployment(継続的デプロイメント) • コードの変更を迅速かつ 安全に展開・配信する • 効果 ◦ 人手によるミスの防止
◦ 素早いユーザーへの 価値提供
9 Free プランでも十分なビルド時間で自動化可能 Free プランでも 十分なビルド時間で自動化可能 ・毎月6,000分相当のクレジッ トを付与、最適なリソース クラス (CPU/RAM)
を選択可能 ・ユーザー数は無制限 だから チーム開発にも適用可能 ・パワフルなリソースクラス 、 Docker コンテナやVM(Linux, Windows, Mac)を利用可能 同じ時間枠でも CircleCI なら 利用可能な機能がこんなにも ・スピードとパフォーマンスが 向上、Docker コンテナを最適化 ・ビルドがより高速化 、 同時に30並列実行まで可能 ・プライベート Orb で CI/CD も コラボレーション 、設定の 部品化、組織内での再利用可能 ・ビルド時間は約2倍 、自動化 の結果をより早く得られます フィードバックループを回し ソフトウェアを素早く届ける ・ビルド時間を短縮可能 なのは ジョブを並列実行できるから ・インテリジェントにテスト 分割した上で並列実行可能 (ファイル数、ファイルサイズ、 ログからの実行時間実績で分割 ) ・インサイト機能で失敗しがち なテストや結果が不安定なテス トなどを抽出可能 ユーザー登録: https://circleci.com/ja/signup/ 料金プラン: https://circleci.com/ja/pricing/ サポート: https://support.circleci.com/hc/ja
10 CircleCIのドキュメント
11 CircleCI ドキュメントの特徴 • オープンソース ◦ テクニカルライターだけでなく、エンジニアも書く ◦ 社内外からプルリクエストが来る •
更新頻度が高い(毎日どこかのページが変更されている) • 翻訳版は現在のところ日本語のみ
12 私の担当範囲 • CircleCI ドキュメント ◦ 日本語翻訳のマネジメント (社内外の翻訳者とやり取り) ◦ 用語集の作成、更新
◦ スタイルガイド作成、更新 ◦ 品質チェック • changelog (リリースノート)、discuss (掲示 板)、ブログ、プロモーションページなどの翻訳 管理も担当
13 ここからは、ドキュメント翻訳をどのように行っているか、 まず基盤の面から紹介していきます。
14 CircleCI ドキュメントの基盤(GitHub)と 翻訳システム(CAT tool) GitHub 記事ファイル テクニカル ライター 社内コントリ
ビューター 社外コントリビュー ター CAT Tool 翻訳メモリー 翻訳者 翻訳者 En Ja ① 記事をプッシュ ② 定期的にSync ③ 原文の変更箇所 だけを翻訳 ④ 翻訳結果をプッシュ CAT: Computer-aided translation
15 こちら側は知ってる人が多いと思います GitHub 記事ファイル テクニカル ライター 社内コントリ ビューター 社外コントリビュー ター
CAT Tool 翻訳メモリー 翻訳者 翻訳者 En Ja ① 記事をプッシュ ② 定期的にSync ③ 原文の変更箇所 だけを翻訳 ④ 翻訳結果をプッシュ
16 今日はCATツールの仕組みや使い方を紹介します GitHub 記事ファイル テクニカル ライター 社内コントリ ビューター 社外コントリビュー ター
CAT Tool 翻訳メモリー 翻訳者 翻訳者 En Ja ① 記事をプッシュ ② 定期的にSync ③ 原文の変更箇所 だけを翻訳 ④ 翻訳結果をプッシュ CAT: Computer-aided translation
17 CATツールとは 翻訳メモリ、用語集などの構成要素について
18 CAT (Computer-aided-translation) は、人間の翻訳をコンピューターが支援 するツール • さまざまなファイル形式を同一のシステム上で扱うことができる • 翻訳メモリ (TM)、用語集、機械翻訳、QAなどの機能
• プロジェクト管理、APIなどの拡張機能を含めて TMS (Translation management system) と呼ばれることもある CATツールとは
19 代表的なTMS https://www.nimdzi.com/the-tms-arena-nimdzi-finger-food/ TMS: Translation Management System. CATツールにプロジェクト管理などの機能が加わったもの
20 文章やパラグラフ単位で過去の翻訳を蓄積したデータベース。 ソース言語とターゲット言語が対になっている。 使われ方 • CATツールで翻訳するとき、翻訳メモリが検索され、同一または 似ている原文に対して翻訳がサジェストされる → 👍 同じ文、似た文を翻訳する手間を省ける
→ 👍 スタイルを統一できる • CATツール上で翻訳すると、自動的に翻訳メモリにデータが 追加・更新される 翻訳メモリとは
21 翻訳料金の計算例 マッチ率 単価 ワード数 金額 100%マッチ ¥5.0 30 ¥150
85-94%マッチ ¥15.0 37 ¥555 75-84%マッチ ¥20.0 96 ¥1,920 50-74%マッチ ¥20.0 700 ¥14,000 ノーマッチ ¥20.0 1250 ¥25,000 • 翻訳メモリがあると、翻訳 コストを下げられる場合が 多い
22 用語集と翻訳メモリはどう違う? • 翻訳メモリだけあれば十分なのでは? • 用語集はどう役に立つの?
23 翻訳エディター画面 (Memsourceの例) https://youtu.be/WHxxxCvNqxo • 「96%マッチ」など、翻訳メモ リとのマッチ率つきで訳文が サジェストされる • 用語集に登録されている語
も、訳語が示される • 機械翻訳の結果を入れるこ ともできる
24 翻訳メモリと用語集 翻訳メモリ • セグメント(文章やパラグラフ)全体にマッチさせ、85% 、50% などの数字を出す • コスト算出に使われる •
翻訳することで自動的にデータが更新される 用語集 • 80%マッチなどの類似度は見ない。(通常1,2語の)単語レベ ルの一致を見る • コスト算出には使われない • 翻訳メモリのように、翻訳すれば自動的に更新されるもので はない • 誰かが新しい用語を提案し、データベースを管理する必要が ある
25 用語集と翻訳メモリ つまり、 • 翻訳メモリは、歴史的な積み上げ • 用語集は、人手で最新に保たれた、その言語を制御する モジュール 翻訳メモリと用語集は、期待される役割が異なり、 組み合わせて使われる。
26 よくある使われ方 • 用語集と翻訳メモリを組み合わせて使い、不一致があれば、用語集を優先 させる ◦ 長年使われている翻訳メモリには「今はもうその言い方はしない」という 翻訳が残っている。用語集は人手で最新に保たれているので、翻訳メ モリとのコンフリクトが起こる。 この場合、用語集に従うべきとする運用が多い。
(そういう使い方をしないなら、翻訳メモリだけでいいという話になる)
27 翻訳メモリの運用Tips • なるべく細かい単位で作っておく ◦ 「ドキュメント」「マーケティングサイト」などのコンテンツ別、部署別など → 👍 これにより、継続的に適切に翻訳メモリが更新される •
read (参照)と write (更新)の設定をうまく使う ◦ マーケティング資料の翻訳では、ドキュメントの翻訳メモリを参照するが、 更新はマーケティングの翻訳メモリのみにする等 • (超基本)使わない翻訳のデータは削除する → 😢 削除しないと、次回以降の翻訳で再び使われる可能性がある
28 用語集の運用Tips • 内容を最新に保つ ◦ 翻訳メモリと違って自動で更新されないので、一度作ってもメンテしないと 全く役に立たなくなる ◦ CircleCI では、社内翻訳者や翻訳会社で用語登録リクエストのスプレッド
シートを共有し、週1回、用語集への追加作業を実施 • 最初は小さく始める ◦ 多すぎてコントロールしにくい状態になるより、不可欠なものだけ少しず つ足していく方が良い • なるべく多くメタデータを付与する ◦ 翻訳者の判断の助けになる
29 用語管理が不十分だとどうなる? • 用語管理は、最初は大 変だが、後になるほど楽 になる ✌ • やらないと、後になるほ ど大変
😱 From: https://www.slideshare.net/akashjd/prof-klaus-terminology-management
30 まとめ • CircleCI ドキュメントの翻訳をどのように行っているか • CATツールとは? • 翻訳メモリ、用語集にはそれぞれどんな役割があるか •
翻訳メモリ、用語集の運用Tips
31 Thank you.