• 企业400电话
  • 微网小程序
  • AI电话机器人
  • 电商代运营
  • 全 部 栏 目

    企业400电话 网络优化推广 AI电话机器人 呼叫中心 网站建设 商标✡知产 微网小程序 电商运营 彩铃•短信 增值拓展业务
    支持汉转拼和拼音分词的PHP中文工具类ChineseUtil

    PHP 中文工具类,支持汉字转拼音、拼音分词、简繁互转。

    PHP Chinese Tool class, support Chinese pinyin, pinyin participle, simplified and traditional conversion

    目前本类库拥有的三个功能,都是在实际开发过程中整理出来的。这次使用的数据不同于以前我开源过汉字转拼音和简繁互转,数据都是从字典网站采集下来的,比以前的数据更加准确。

    由于中文的博大精深,字有多音字,简体字和繁体字也有多种对应。并且本类库返回的所有结果,均为包含所有组合的数组。

    本类库字典数据加载后会占用 40+ MB 内存,在访问量大的接口要使用此类汉字转拼音、繁简转换功能时,推荐用 Swoole 开发一个异步服务程序,只需加载一次数据,就可以持续高效地为你提供服务。

    使用说明

    Composer 直接安装

    composer require yurunsoft/chinese-util

    Composer 项目配置引入

    "require": {
      "yurunsoft/chinese-util" : "~1.0"
    }
    

    功能

    汉字转拼音

    use \Yurun\Util\Chinese;
    $string = '恭喜發財!把我翻译成拼音看下?';
    echo $string, PHP_EOL;
    
    echo '所有结果:', PHP_EOL;
    var_dump(Chinese::toPinyin($string));
    
    echo '全拼:', PHP_EOL;
    var_dump(Chinese::toPinyin($string, Pinyin::CONVERT_MODE_PINYIN));
    
    echo '首字母:', PHP_EOL;
    var_dump(Chinese::toPinyin($string, Pinyin::CONVERT_MODE_PINYIN_FIRST));
    
    echo '读音:', PHP_EOL;
    var_dump(Chinese::toPinyin($string, Pinyin::CONVERT_MODE_PINYIN_SOUND));
    
    echo '读音数字:', PHP_EOL;
    var_dump(Chinese::toPinyin($string, Pinyin::CONVERT_MODE_PINYIN_SOUND_NUMBER));
    
    echo '自选 + 自定义分隔符:', PHP_EOL;
    var_dump(Chinese::toPinyin($string, Pinyin::CONVERT_MODE_PINYIN | Pinyin::CONVERT_MODE_PINYIN_SOUND_NUMBER, '/'));
    
    
    /**
    输出结果:
    array(4) {
     ["pinyin"]=>
     array(1) {
      [0]=>
      string(58) "gong xi fa cai ! ba wo fan yi cheng pin yin kan xia ? "
     }
     ["pinyinSound"]=>
     array(4) {
      [0]=>
      string(63) "gōng xǐ fā cái bǎ wǒ fān yì chéng pīn yīn kàn xià "
      [1]=>
      string(63) "gōng xǐ fā cái bà wǒ fān yì chéng pīn yīn kàn xià "
      [2]=>
      string(63) "gōng xǐ fā cái bǎ wǒ fān yì chéng pīn yīn kān xià "
      [3]=>
      string(63) "gōng xǐ fā cái bà wǒ fān yì chéng pīn yīn kān xià "
     }
     ["pinyinSoundNumber"]=>
     array(4) {
      [0]=>
      string(63) "gong1 xi3 fa1 cai2 ba3 wo3 fan1 yi4 cheng2 pin1 yin1 kan4 xia4 "
      [1]=>
      string(63) "gong1 xi3 fa1 cai2 ba4 wo3 fan1 yi4 cheng2 pin1 yin1 kan4 xia4 "
      [2]=>
      string(63) "gong1 xi3 fa1 cai2 ba3 wo3 fan1 yi4 cheng2 pin1 yin1 kan1 xia4 "
      [3]=>
      string(63) "gong1 xi3 fa1 cai2 ba4 wo3 fan1 yi4 cheng2 pin1 yin1 kan1 xia4 "
     }
     ["pinyinFirst"]=>
     array(1) {
      [0]=>
      string(34) "g x f c ! b w f y c p y k x ? "
     }
    }
    全拼:
    array(1) {
     ["pinyin"]=>
     array(1) {
      [0]=>
      string(58) "gong xi fa cai ! ba wo fan yi cheng pin yin kan xia ? "
     }
    }
    首字母:
    array(1) {
     ["pinyinFirst"]=>
     array(1) {
      [0]=>
      string(34) "g x f c ! b w f y c p y k x ? "
     }
    }
    读音:
    array(1) {
     ["pinyinSound"]=>
     array(4) {
      [0]=>
      string(63) "gōng xǐ fā cái bǎ wǒ fān yì chéng pīn yīn kàn xià "
      [1]=>
      string(63) "gōng xǐ fā cái bà wǒ fān yì chéng pīn yīn kàn xià "
      [2]=>
      string(63) "gōng xǐ fā cái bǎ wǒ fān yì chéng pīn yīn kān xià "
      [3]=>
      string(63) "gōng xǐ fā cái bà wǒ fān yì chéng pīn yīn kān xià "
     }
    }
    读音数字:
    array(1) {
     ["pinyinSoundNumber"]=>
     array(4) {
      [0]=>
      string(63) "gong1 xi3 fa1 cai2 ba3 wo3 fan1 yi4 cheng2 pin1 yin1 kan4 xia4 "
      [1]=>
      string(63) "gong1 xi3 fa1 cai2 ba4 wo3 fan1 yi4 cheng2 pin1 yin1 kan4 xia4 "
      [2]=>
      string(63) "gong1 xi3 fa1 cai2 ba3 wo3 fan1 yi4 cheng2 pin1 yin1 kan1 xia4 "
      [3]=>
      string(63) "gong1 xi3 fa1 cai2 ba4 wo3 fan1 yi4 cheng2 pin1 yin1 kan1 xia4 "
     }
    }
    自选 + 自定义分隔符:
    array(2) {
     ["pinyin"]=>
     array(1) {
      [0]=>
      string(58) "gong/xi/fa/cai/!/ba/wo/fan/yi/cheng/pin/yin/kan/xia/?/"
     }
     ["pinyinSoundNumber"]=>
     array(4) {
      [0]=>
      string(63) "gong1/xi3/fa1/cai2/ba3/wo3/fan1/yi4/cheng2/pin1/yin1/kan4/xia4/"
      [1]=>
      string(63) "gong1/xi3/fa1/cai2/ba4/wo3/fan1/yi4/cheng2/pin1/yin1/kan4/xia4/"
      [2]=>
      string(63) "gong1/xi3/fa1/cai2/ba3/wo3/fan1/yi4/cheng2/pin1/yin1/kan1/xia4/"
      [3]=>
      string(63) "gong1/xi3/fa1/cai2/ba4/wo3/fan1/yi4/cheng2/pin1/yin1/kan1/xia4/"
     }
    }
     * /
    

    拼音分词

    use \Yurun\Util\Chinese;
    $string2 = 'xianggang';
    echo '"', $string2, '"的分词结果:', PHP_EOL;
    var_dump(Chinese::splitPinyin($string2));
    /**
    输出结果:
    "xianggang"的分词结果:
    array(2) {
     [0]=>
     string(12) "xi ang gang "
     [1]=>
     string(11) "xiang gang "
    }
     * /
    

    简繁互转

    use \Yurun\Util\Chinese;
    $string3 = '中华人民共和国!恭喜發財!';
    echo '"', $string3, '"的简体转换:', PHP_EOL;
    var_dump(Chinese::toSimplified($string3));
    echo '"', $string3, '"的繁体转换:', PHP_EOL;
    var_dump(Chinese::toTraditional($string3));
    /**
    输出结果:
    "中华人民共和国!恭喜發財!"的简体转换:
    array(1) {
     [0]=>
     string(39) "中华人民共和国!恭喜发财!"
    }
    "中华人民共和国!恭喜發財!"的繁体转换:
    array(1) {
     [0]=>
     string(39) "中華人民共和國!恭喜發財!"
    }
     * /
    

    您可能感兴趣的文章:
    • PHP中文分词 自动获取关键词介绍
    • 开源php中文分词系统SCWS安装和使用实例
    • PHP中文分词的简单实现代码分享
    • PHPAnalysis中文分词类详解
    • php实现的中文分词类完整实例
    • php实现scws中文分词搜索的方法
    • 使用Discuz关键词服务器实现PHP中文分词
    • php+正则将字符串中的字母数字和中文分割
    • php中文语义分析实现方法示例
    上一篇:对于Laravel 5.5核心架构的深入理解
    下一篇:Laravel 实现密码重置功能
  • 相关文章
  • 

    © 2016-2020 巨人网络通讯

    时间:9:00-21:00 (节假日不休)

    地址:江苏信息产业基地11号楼四层

    《增值电信业务经营许可证》 苏B2-20120278

    支持汉转拼和拼音分词的PHP中文工具类ChineseUtil 支持,汉转,拼,和,拼音,分词,