Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ドキュメントの翻訳に必要なこと
Search
Mayuko Sawai
May 15, 2022
Technology
0
730
ドキュメントの翻訳に必要なこと
LINE Technical Writing Meetup vol.13 (2022/5/12)での発表資料です。
Mayuko Sawai
May 15, 2022
Tweet
Share
More Decks by Mayuko Sawai
See All by Mayuko Sawai
テクニカルライターに必要な知識を学べる大学院の紹介/Introduction Master TCLoc
mayukosawai
2
830
Other Decks in Technology
See All in Technology
Functional TypeScript
naoya
11
4.8k
Road to Single Activity
yurihondo
2
240
開発生産性を始める前に開発チームができること / optim-improve-development-productivity.pdf
optim
0
130
Jetpack Compose Modifier 徹底解説 / Jetpack Compose Modifier
wiroha
0
200
ロリポップ! for Gamersを支えるインフラ/lolipop for gamers infrastructure
takumakume
0
140
AI活用したくてもできなかった不動産SaaSの今とこれから
nealle
0
340
『GRANBLUE FANTASY: Relink』クオリティと物量の両立に挑戦したフェイシャルアニメーション事例 ~カットシーンからランタイムまで~
cygames
0
110
Oracle Autonomous Database:サービス概要のご紹介
oracle4engineer
PRO
1
7.1k
公共交通データとアプリ制作 - Mini Tokyo 3D の初期制作過程を振り返る
nagix
0
100
開発者の定量・定性データを組み合わせて開発者体験を把握するための取り組み
ham0215
1
150
不動産売買取引におけるAIの可能性とプロダクトでのAI活用
zabio3
0
270
「家族アルバム みてね」における運用管理・ オブザーバビリティの全貌 / Overview of Operation Management and Observability in FamilyAlbum
isaoshimizu
4
160
Featured
See All Featured
Statistics for Hackers
jakevdp
794
220k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
663
120k
Done Done
chrislema
180
16k
How GitHub (no longer) Works
holman
310
140k
Fantastic passwords and where to find them - at NoRuKo
philnash
48
2.8k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
36
2.1k
The Art of Programming - Codeland 2020
erikaheidi
48
13k
The Cult of Friendly URLs
andyhume
76
6k
In The Pink: A Labor of Love
frogandcode
139
22k
How to Think Like a Performance Engineer
csswizardry
16
960
Imperfection Machines: The Place of Print at Facebook
scottboms
263
13k
Building an army of robots
kneath
302
42k
Transcript
1 ドキュメントの翻訳に 必要なこと 澤井 真佑子 Technical Writer, CircleCI
2 本日の発表 • このような方向け ◦ ドキュメントの翻訳を他の会社はどうやっているのか聞 いてみたい ◦ どんな準備やツールが必要か知りたい
3 • ドキュメントサイトの翻訳をどの ように行っているか? • 翻訳に使われるCATツール、翻 訳メモリや用語集の扱い方 など お話しする内容
4 自己紹介 • 名前:澤井 真佑子 / Mayuko Sawai Technical Writer
@ CircleCI (2021.12 〜) • 経歴 ◦ 前職はサイボウズのテクニカルライター • ストラスブール大学のオンライン修士課程で Technical communication & Localization を 勉強中 (LINE TWM vol.7 で紹介) 「テクニカルライターが働きながら学ぶ大学院を紹介します」 https://blog.cybozu.io/entry/2021/09/10/084825
5 CircleCIの紹介
6 CircleCIの概要
7 Continuous Integration(継続的インテグレーション) • コードの変更を迅速かつ安全に マージできる ◦ ビルド ◦ コード解析
◦ 自動化されたテスト ◦ 脆弱性チェック • 効果 ◦ 手戻りの防止 ◦ リリース品質の向上 ◦ 長期的なコスト削減
8 Continuous Deployment(継続的デプロイメント) • コードの変更を迅速かつ 安全に展開・配信する • 効果 ◦ 人手によるミスの防止
◦ 素早いユーザーへの 価値提供
9 Free プランでも十分なビルド時間で自動化可能 Free プランでも 十分なビルド時間で自動化可能 ・毎月6,000分相当のクレジッ トを付与、最適なリソース クラス (CPU/RAM)
を選択可能 ・ユーザー数は無制限 だから チーム開発にも適用可能 ・パワフルなリソースクラス 、 Docker コンテナやVM(Linux, Windows, Mac)を利用可能 同じ時間枠でも CircleCI なら 利用可能な機能がこんなにも ・スピードとパフォーマンスが 向上、Docker コンテナを最適化 ・ビルドがより高速化 、 同時に30並列実行まで可能 ・プライベート Orb で CI/CD も コラボレーション 、設定の 部品化、組織内での再利用可能 ・ビルド時間は約2倍 、自動化 の結果をより早く得られます フィードバックループを回し ソフトウェアを素早く届ける ・ビルド時間を短縮可能 なのは ジョブを並列実行できるから ・インテリジェントにテスト 分割した上で並列実行可能 (ファイル数、ファイルサイズ、 ログからの実行時間実績で分割 ) ・インサイト機能で失敗しがち なテストや結果が不安定なテス トなどを抽出可能 ユーザー登録: https://circleci.com/ja/signup/ 料金プラン: https://circleci.com/ja/pricing/ サポート: https://support.circleci.com/hc/ja
10 CircleCIのドキュメント
11 CircleCI ドキュメントの特徴 • オープンソース ◦ テクニカルライターだけでなく、エンジニアも書く ◦ 社内外からプルリクエストが来る •
更新頻度が高い(毎日どこかのページが変更されている) • 翻訳版は現在のところ日本語のみ
12 私の担当範囲 • CircleCI ドキュメント ◦ 日本語翻訳のマネジメント (社内外の翻訳者とやり取り) ◦ 用語集の作成、更新
◦ スタイルガイド作成、更新 ◦ 品質チェック • changelog (リリースノート)、discuss (掲示 板)、ブログ、プロモーションページなどの翻訳 管理も担当
13 ここからは、ドキュメント翻訳をどのように行っているか、 まず基盤の面から紹介していきます。
14 CircleCI ドキュメントの基盤(GitHub)と 翻訳システム(CAT tool) GitHub 記事ファイル テクニカル ライター 社内コントリ
ビューター 社外コントリビュー ター CAT Tool 翻訳メモリー 翻訳者 翻訳者 En Ja ① 記事をプッシュ ② 定期的にSync ③ 原文の変更箇所 だけを翻訳 ④ 翻訳結果をプッシュ CAT: Computer-aided translation
15 こちら側は知ってる人が多いと思います GitHub 記事ファイル テクニカル ライター 社内コントリ ビューター 社外コントリビュー ター
CAT Tool 翻訳メモリー 翻訳者 翻訳者 En Ja ① 記事をプッシュ ② 定期的にSync ③ 原文の変更箇所 だけを翻訳 ④ 翻訳結果をプッシュ
16 今日はCATツールの仕組みや使い方を紹介します GitHub 記事ファイル テクニカル ライター 社内コントリ ビューター 社外コントリビュー ター
CAT Tool 翻訳メモリー 翻訳者 翻訳者 En Ja ① 記事をプッシュ ② 定期的にSync ③ 原文の変更箇所 だけを翻訳 ④ 翻訳結果をプッシュ CAT: Computer-aided translation
17 CATツールとは 翻訳メモリ、用語集などの構成要素について
18 CAT (Computer-aided-translation) は、人間の翻訳をコンピューターが支援 するツール • さまざまなファイル形式を同一のシステム上で扱うことができる • 翻訳メモリ (TM)、用語集、機械翻訳、QAなどの機能
• プロジェクト管理、APIなどの拡張機能を含めて TMS (Translation management system) と呼ばれることもある CATツールとは
19 代表的なTMS https://www.nimdzi.com/the-tms-arena-nimdzi-finger-food/ TMS: Translation Management System. CATツールにプロジェクト管理などの機能が加わったもの
20 文章やパラグラフ単位で過去の翻訳を蓄積したデータベース。 ソース言語とターゲット言語が対になっている。 使われ方 • CATツールで翻訳するとき、翻訳メモリが検索され、同一または 似ている原文に対して翻訳がサジェストされる → 👍 同じ文、似た文を翻訳する手間を省ける
→ 👍 スタイルを統一できる • CATツール上で翻訳すると、自動的に翻訳メモリにデータが 追加・更新される 翻訳メモリとは
21 翻訳料金の計算例 マッチ率 単価 ワード数 金額 100%マッチ ¥5.0 30 ¥150
85-94%マッチ ¥15.0 37 ¥555 75-84%マッチ ¥20.0 96 ¥1,920 50-74%マッチ ¥20.0 700 ¥14,000 ノーマッチ ¥20.0 1250 ¥25,000 • 翻訳メモリがあると、翻訳 コストを下げられる場合が 多い
22 用語集と翻訳メモリはどう違う? • 翻訳メモリだけあれば十分なのでは? • 用語集はどう役に立つの?
23 翻訳エディター画面 (Memsourceの例) https://youtu.be/WHxxxCvNqxo • 「96%マッチ」など、翻訳メモ リとのマッチ率つきで訳文が サジェストされる • 用語集に登録されている語
も、訳語が示される • 機械翻訳の結果を入れるこ ともできる
24 翻訳メモリと用語集 翻訳メモリ • セグメント(文章やパラグラフ)全体にマッチさせ、85% 、50% などの数字を出す • コスト算出に使われる •
翻訳することで自動的にデータが更新される 用語集 • 80%マッチなどの類似度は見ない。(通常1,2語の)単語レベ ルの一致を見る • コスト算出には使われない • 翻訳メモリのように、翻訳すれば自動的に更新されるもので はない • 誰かが新しい用語を提案し、データベースを管理する必要が ある
25 用語集と翻訳メモリ つまり、 • 翻訳メモリは、歴史的な積み上げ • 用語集は、人手で最新に保たれた、その言語を制御する モジュール 翻訳メモリと用語集は、期待される役割が異なり、 組み合わせて使われる。
26 よくある使われ方 • 用語集と翻訳メモリを組み合わせて使い、不一致があれば、用語集を優先 させる ◦ 長年使われている翻訳メモリには「今はもうその言い方はしない」という 翻訳が残っている。用語集は人手で最新に保たれているので、翻訳メ モリとのコンフリクトが起こる。 この場合、用語集に従うべきとする運用が多い。
(そういう使い方をしないなら、翻訳メモリだけでいいという話になる)
27 翻訳メモリの運用Tips • なるべく細かい単位で作っておく ◦ 「ドキュメント」「マーケティングサイト」などのコンテンツ別、部署別など → 👍 これにより、継続的に適切に翻訳メモリが更新される •
read (参照)と write (更新)の設定をうまく使う ◦ マーケティング資料の翻訳では、ドキュメントの翻訳メモリを参照するが、 更新はマーケティングの翻訳メモリのみにする等 • (超基本)使わない翻訳のデータは削除する → 😢 削除しないと、次回以降の翻訳で再び使われる可能性がある
28 用語集の運用Tips • 内容を最新に保つ ◦ 翻訳メモリと違って自動で更新されないので、一度作ってもメンテしないと 全く役に立たなくなる ◦ CircleCI では、社内翻訳者や翻訳会社で用語登録リクエストのスプレッド
シートを共有し、週1回、用語集への追加作業を実施 • 最初は小さく始める ◦ 多すぎてコントロールしにくい状態になるより、不可欠なものだけ少しず つ足していく方が良い • なるべく多くメタデータを付与する ◦ 翻訳者の判断の助けになる
29 用語管理が不十分だとどうなる? • 用語管理は、最初は大 変だが、後になるほど楽 になる ✌ • やらないと、後になるほ ど大変
😱 From: https://www.slideshare.net/akashjd/prof-klaus-terminology-management
30 まとめ • CircleCI ドキュメントの翻訳をどのように行っているか • CATツールとは? • 翻訳メモリ、用語集にはそれぞれどんな役割があるか •
翻訳メモリ、用語集の運用Tips
31 Thank you.