20250614_LT_走れメロスの個人情報マスク処理をMacStudio 512GBメモリマシンで試してみた

LT : 「⾛れメロス」の個⼈情報マスク処理を Mac Studio 512GBメモリマシンで試してみた 2025/6/14 @doradora09

Mac Studio 512GBメモリマシン • メモリ512GBまでマシましにできるポータブルPC(4kg) • LLMの⼤きいモデルが動くので今回実験
利⽤

Mac Studio 512GBメモリマシン • ちなみにスペック増し増しにすると200万を超えます・・ • ( ３台買ったらカード
を⽌められたのは良い？思い出・・ )

閑話休題：⾛れメロス • ⻘空⽂庫で全⽂公開されてます • https://www.aozora.gr.jp/cards/000035/files/1567_14913.html • ローカルLLMで「メロス」や「セリヌンティウス」などの名称をマスクしたい -> これができれば、社内でいろんなデータをLLMに⾷わせて処理できる
-> また、マスク後データを外部のさらに性能の良いAPIに投げて分析させるとかもできて良さげ • 現時点での結論 • Mac Studio 512GBならいけそう • 128GBメモリのMac Boop Proだと厳しいかも？

原⽂ • だいたい１万⽂字くらいの物語

LM StudioでLlama-4を動かす • Mavericのモデルは230GBくらい容量あるのでダウンロードの帯域とか注意( スマホテザリングではやらない⽅が吉・・ ) • メモリ使⽤量はこんな感じ

注意：トークン⻑は伸ばしておくこと • ML Studioでロードしたモデルのデフォルトが4000トークンくらいなので、 input/outputの⽂字数が全然⾜りない (2000⽂字くらい)
• 設定で5-10万トークンにしておけばOK

参考：Llama-4 Mavericのメモリ使⽤量 • 240GBくらい • 頑張れば２本くらい⾛らせられる？

今回⽤いたプロンプト・指⽰以下の原⽂に対して、個⼈が特定できないように⽒名のマスクをお願いします。また後で復元できるように対応表を作成し、最初と最後に提⽰してください。【⼈物１】のようなイメージでお願いします。・原⽂⾛れメロス太宰治メロスは激怒した。必ず、かの邪智暴虐の王を除かなければなら
ぬと決意した。メロスには政治がわからぬ。・・・(以下、最後まで記載)

実⾏結果① ( Llama-4 Maveric ) • とても良い感じです • 動作中のメモリ使⽤量は 266GBくらい
• 15token/sec、くらいのスピードは出てそうです

実⾏結果② ( Llama-4 scout-17b-16e ) • やや、いい感じです ( アレキスが⾜りない )
• 動作中のメモリ使⽤量は 116GBくらい • 15token/sec、くらいのスピードは出てそうです

実⾏結果③ ( Llama-3.3-70b ) • 少し間違えているものの、概ねOK ( 太宰治を⼈物２、とかたまに間違えている )
• 動作中のメモリ使⽤量は87GBくらい • 5token/sec、くらいのスピードなのでやや遅めですが許容範囲

実⾏結果④ ( Llama-4 dolphin-8B ) • 全然ダメでした ( そもそも指⽰を聞いておらず、おうむ返し
) ・トークン⻑も8000トークンくらいが上限だったので2000⽂字まで縮⼩して実験

参考：各モデルの特徴⽐較

その他所感等 • Llama-4 mavericでようやく及第点。ただ、⼗分ではない ( ChatGPT-4と4oの中間くらいの感覚 ) • 個⼈情報マスクは⼗分だが、バイブコーディングで分析させるにはまだ弱い印象(
複雑な分析は失敗する ) • ⼀⽅で「どんなデータでもローカルで安全に扱える」という点はやはりデカい • ローカルLLM活⽤も引き続き⾊々検証していきたいと思います

Enjoy..!!

20250614_LT_走れメロスの個人情報マスク処理をMacStudio 512GBメモリマ...

20250614_LT_走れメロスの個人情報マスク処理をMacStudio 512GBメモリマシンで試してみた

NobuakiOshiro PRO

More Decks by NobuakiOshiro

Other Decks in Technology

Featured

Transcript

LT : 「⾛れメロス」の個⼈情報マスク処理を Mac Studio 512GBメモリマシンで試してみた 2025/6/14 @doradora09

Mac Studio 512GBメモリマシン • メモリ512GBまでマシましにできるポータブルPC(4kg) • LLMの⼤きいモデルが動くので今回実験

Mac Studio 512GBメモリマシン • ちなみにスペック増し増しにすると200万を超えます・・ • ( ３台買ったらカード

原⽂ • だいたい１万⽂字くらいの物語

LM StudioでLlama-4を動かす • Mavericのモデルは230GBくらい容量あるのでダウンロードの帯域とか注意( スマホテザリングではやらない⽅が吉・・ ) • メモリ使⽤量はこんな感じ

注意：トークン⻑は伸ばしておくこと • ML Studioでロードしたモデルのデフォルトが4000トークンくらいなので、 input/outputの⽂字数が全然⾜りない (2000⽂字くらい)

参考：Llama-4 Mavericのメモリ使⽤量 • 240GBくらい • 頑張れば２本くらい⾛らせられる？

実⾏結果① ( Llama-4 Maveric ) • とても良い感じです • 動作中のメモリ使⽤量は 266GBくらい

実⾏結果② ( Llama-4 scout-17b-16e ) • やや、いい感じです ( アレキスが⾜りない )

実⾏結果③ ( Llama-3.3-70b ) • 少し間違えているものの、概ねOK ( 太宰治を⼈物２、とかたまに間違えている )

実⾏結果④ ( Llama-4 dolphin-8B ) • 全然ダメでした ( そもそも指⽰を聞いておらず、おうむ返し

参考：各モデルの特徴⽐較

その他所感等 • Llama-4 mavericでようやく及第点。ただ、⼗分ではない ( ChatGPT-4と4oの中間くらいの感覚 ) • 個⼈情報マスクは⼗分だが、バイブコーディングで分析させるにはまだ弱い印象(

Enjoy..!!