Upgrade to Pro — share decks privately, control downloads, hide ads and more …

ドキュメントの翻訳に必要なこと

 ドキュメントの翻訳に必要なこと

LINE Technical Writing Meetup vol.13 (2022/5/12)での発表資料です。

Mayuko Sawai

May 15, 2022
Tweet

More Decks by Mayuko Sawai

Other Decks in Technology

Transcript

  1. 4 自己紹介 • 名前:澤井 真佑子 / Mayuko Sawai Technical Writer

    @ CircleCI (2021.12 〜) • 経歴 ◦ 前職はサイボウズのテクニカルライター • ストラスブール大学のオンライン修士課程で Technical communication & Localization を 勉強中 (LINE TWM vol.7 で紹介) 「テクニカルライターが働きながら学ぶ大学院を紹介します」    https://blog.cybozu.io/entry/2021/09/10/084825
  2. 7 Continuous Integration(継続的インテグレーション) • コードの変更を迅速かつ安全に マージできる ◦ ビルド ◦ コード解析

    ◦ 自動化されたテスト ◦ 脆弱性チェック • 効果 ◦ 手戻りの防止 ◦ リリース品質の向上 ◦ 長期的なコスト削減
  3. 9 Free プランでも十分なビルド時間で自動化可能 Free プランでも 十分なビルド時間で自動化可能 ・毎月6,000分相当のクレジッ  トを付与、最適なリソース  クラス (CPU/RAM)

    を選択可能 ・ユーザー数は無制限 だから  チーム開発にも適用可能 ・パワフルなリソースクラス 、  Docker コンテナやVM(Linux,  Windows, Mac)を利用可能 同じ時間枠でも CircleCI なら 利用可能な機能がこんなにも ・スピードとパフォーマンスが  向上、Docker コンテナを最適化 ・ビルドがより高速化 、  同時に30並列実行まで可能 ・プライベート Orb で CI/CD も  コラボレーション 、設定の  部品化、組織内での再利用可能 ・ビルド時間は約2倍 、自動化  の結果をより早く得られます フィードバックループを回し ソフトウェアを素早く届ける ・ビルド時間を短縮可能 なのは  ジョブを並列実行できるから ・インテリジェントにテスト  分割した上で並列実行可能  (ファイル数、ファイルサイズ、   ログからの実行時間実績で分割 ) ・インサイト機能で失敗しがち  なテストや結果が不安定なテス  トなどを抽出可能 ユーザー登録: https://circleci.com/ja/signup/ 料金プラン: https://circleci.com/ja/pricing/ サポート: https://support.circleci.com/hc/ja
  4. 11 CircleCI ドキュメントの特徴 • オープンソース ◦ テクニカルライターだけでなく、エンジニアも書く ◦ 社内外からプルリクエストが来る •

    更新頻度が高い(毎日どこかのページが変更されている) • 翻訳版は現在のところ日本語のみ
  5. 12 私の担当範囲 • CircleCI ドキュメント ◦ 日本語翻訳のマネジメント (社内外の翻訳者とやり取り) ◦ 用語集の作成、更新

    ◦ スタイルガイド作成、更新 ◦ 品質チェック • changelog (リリースノート)、discuss (掲示 板)、ブログ、プロモーションページなどの翻訳 管理も担当
  6. 14 CircleCI ドキュメントの基盤(GitHub)と 翻訳システム(CAT tool) GitHub 記事ファイル テクニカル ライター 社内コントリ

    ビューター 社外コントリビュー ター CAT Tool 翻訳メモリー 翻訳者 翻訳者 En Ja ① 記事をプッシュ ② 定期的にSync ③ 原文の変更箇所  だけを翻訳 ④ 翻訳結果をプッシュ CAT: Computer-aided translation
  7. 15 こちら側は知ってる人が多いと思います GitHub 記事ファイル テクニカル ライター 社内コントリ ビューター 社外コントリビュー ター

    CAT Tool 翻訳メモリー 翻訳者 翻訳者 En Ja ① 記事をプッシュ ② 定期的にSync ③ 原文の変更箇所  だけを翻訳 ④ 翻訳結果をプッシュ
  8. 16 今日はCATツールの仕組みや使い方を紹介します GitHub 記事ファイル テクニカル ライター 社内コントリ ビューター 社外コントリビュー ター

    CAT Tool 翻訳メモリー 翻訳者 翻訳者 En Ja ① 記事をプッシュ ② 定期的にSync ③ 原文の変更箇所  だけを翻訳 ④ 翻訳結果をプッシュ CAT: Computer-aided translation
  9. 21 翻訳料金の計算例 マッチ率 単価 ワード数 金額 100%マッチ ¥5.0 30 ¥150

    85-94%マッチ ¥15.0 37 ¥555 75-84%マッチ ¥20.0 96 ¥1,920 50-74%マッチ ¥20.0 700 ¥14,000 ノーマッチ ¥20.0 1250 ¥25,000 • 翻訳メモリがあると、翻訳 コストを下げられる場合が 多い
  10. 24 翻訳メモリと用語集 翻訳メモリ • セグメント(文章やパラグラフ)全体にマッチさせ、85% 、50% などの数字を出す • コスト算出に使われる •

    翻訳することで自動的にデータが更新される 用語集 • 80%マッチなどの類似度は見ない。(通常1,2語の)単語レベ ルの一致を見る • コスト算出には使われない • 翻訳メモリのように、翻訳すれば自動的に更新されるもので はない • 誰かが新しい用語を提案し、データベースを管理する必要が ある
  11. 27 翻訳メモリの運用Tips • なるべく細かい単位で作っておく ◦ 「ドキュメント」「マーケティングサイト」などのコンテンツ別、部署別など → 👍 これにより、継続的に適切に翻訳メモリが更新される •

    read (参照)と write (更新)の設定をうまく使う ◦ マーケティング資料の翻訳では、ドキュメントの翻訳メモリを参照するが、 更新はマーケティングの翻訳メモリのみにする等 • (超基本)使わない翻訳のデータは削除する → 😢 削除しないと、次回以降の翻訳で再び使われる可能性がある
  12. 28  用語集の運用Tips • 内容を最新に保つ ◦ 翻訳メモリと違って自動で更新されないので、一度作ってもメンテしないと 全く役に立たなくなる ◦ CircleCI では、社内翻訳者や翻訳会社で用語登録リクエストのスプレッド

    シートを共有し、週1回、用語集への追加作業を実施 • 最初は小さく始める ◦ 多すぎてコントロールしにくい状態になるより、不可欠なものだけ少しず つ足していく方が良い • なるべく多くメタデータを付与する ◦ 翻訳者の判断の助けになる