Lock in $30 Savings on PRO—Offer Ends Soon! ⏳

PHP 8.5の裏話

PHP 8.5の裏話

Avatar for てきめん tekimen

てきめん tekimen PRO

November 26, 2025
Tweet

More Decks by てきめん tekimen

Other Decks in Programming

Transcript

  1. Onigurumaの開発終了 • Onigurumaが開発終了 – https://github.com/kkos/oniguruma/ • This project ended on

    April 24, 2025. • PHPではmbregex(mb_eregなど)で使っている – OnigurumaはVSCodeなどでユースケースがありなかなか止められない – 膠着状態で板挟み状態 • mbstringのAlexさんはOnigurumaをメンテしてでも維持したい、PHP Internalsは PCREでいいのではないかという意見 • 解決策が見当たらない
  2. grapheme関数にロケールを追加 • grapheme_strpos、grapheme_stripos、grapheme_strrpos、 grapheme_strripos、grapheme_strstr、grapheme_stristr、 grapheme_levenshtein関数にロケールを追加 – grapheme_levenshtein関数の修正RFCでもある • トルコ語のİとiとをマッチさせたり(tr_TR)できます •

    ロケールというか、LDMLベースで決められます – ちょっと複雑 https://www.unicode.org/reports/tr35/ – 日本語の異体字でも使えます 邊とか – 複雑にしてすいません感がある
  3. PHP 8.5の開発で感じたこと • もうmbstring関数は増えないかもしれない – ただ、コードポイント単位のプログラミングをしたいというニーズはまだあるはずなので主張はしていきたいが – Unicodeのネイティブ世代として要求される知識量は増えたと感じている • CJKの事情を伝えるのに遠く感じる

    – Onigurumaでも感じたけど簡素化したい感は感じる – Unicodeでいいと思っていそうな割にCJKの事情はわかってなさそうなのでちゃんと伝えないといけないと感じる • CJKだけじゃなくアラビア語などRtoLの言語でもどういう事情なのかとかは知りたいし • Unicodeのプログラミングは複雑である – LDMLをはじめ、ちゃんと勉強しないと文字の処理がうまくいかないことがある – 特に異体字はちゃんとしないと、自分の名前が表示されないというユーザーからの要請に答えられない • これは名前というアイデンティティの問題なので、ちゃんとしてほしい。する土壌は整えている • もっとアジア圏からPHPへの意見を出してほしい感はある