delphi 判断字符串是否包含汉字,正则版与非正则版实现

寻技术 Delphi 2023年09月01日 116

代码一

//正则版

uses RegularExpressions; //相关单元

function IsChineseStr(s: String): Boolean;

const
pattern ='[\x{4E00}-\x{9FA5}]'; //测试用的表达式
begin
Result:=false;
if TRegEx.IsMatch(s, pattern) then
begin
Result:=True;

end;
end;

//非正则版

function isChina(S: string): Boolean;
var
  pStr: PWideChar;
begin
  Result := false;
  pStr := PChar(S);
  while pStr^ <> #0 do
  begin
    case pStr^ of
      Char($4E00)..Char($9FCB):
        begin
          Result := True;
          Break;
        end;
    end;
    Inc(pStr);
  end;
end;

河南-风 delphi学习网 2020/5/26 17:13:33 改进版

function IsChina(S: string): Boolean;
var
  pStr: PWideChar;
  function HexToInt(const HexValue: string): Integer;
  begin
    Val('$' + HexValue, Result, Result);
  end;

  function InChar(AChar: Char; AStart, AEnd: string): Boolean;
  begin
    Result := (Ord(AChar) >= HexToInt(AStart)) and (Ord(AChar) <= HexToInt(AEnd))
  end;
begin
  Result := false;
  pStr := PWideChar(S);
  while pStr^ <> #0 do
  begin
    if InChar(pStr^, '4E00', '9FA5')  //
      or InChar(pStr^, '9FA6', '9FEF')    //基本汉字补充74字
      or InChar(pStr^, '3400', '4DB5')    //扩展A
      or InChar(pStr^, '20000', '2A6D6')  //扩展B42711字
      or InChar(pStr^, '2A700', '2B734')  //扩展C4149字
      or InChar(pStr^, '2B740', '2B81D')  //扩展D222字2B740-2B81D
      or InChar(pStr^, '2B820', '2CEA1')  //PUA(GBK)部件81字E815-E86F
      or InChar(pStr^, 'E815', 'E86F')    //扩展E5762字2B820-2CEA1
      or InChar(pStr^, '2CEB0', '2EBE0')   //扩展F7473字2CEB0-2EBE0
      or InChar(pStr^, '30000', '3134A')   //扩展G4939字30000-3134A
      or InChar(pStr^, '2F00', '2FD5')     //康熙部首214字2F00-2FD5
      or InChar(pStr^, '2E80', '2EF3')     //部首扩展115字2E80-2EF3
      or InChar(pStr^, 'F900', 'FAD9')     //兼容汉字477字F900-FAD9
      or InChar(pStr^, '2F800', '2FA1D')  //兼容扩展542字2F800-2FA1D
      or InChar(pStr^, 'E400', 'E5E8')   //部件扩展452字E400-E5E8
      or InChar(pStr^, 'E600', 'E6CF')   //PUA增补207字E600-E6CF
      or InChar(pStr^, '31C0', '31E3')   //汉字笔画36字31C0-31E3
      or InChar(pStr^, '2FF0', '2FFB')   //汉字结构12字2FF0-2FFB
      or InChar(pStr^, '3105', '312F')   //汉语注音43字3105-312F
      or InChar(pStr^, '31A0', '31BA')   //注音扩展22字31A0-31BA
      or InChar(pStr^, '3007', '3007')   //?1字3007
      then
    begin
      Result := True;
      Break;
    end;
    Inc(pStr);
  end;
end;

版本3:qq281309196 黑夜杀手提供

上面代码可以满足大部分需求。

大悟还俗 DelphiFmx.com 发现非正则得小问题:

想玩精密点得可以参考下面:qq281309196 黑夜杀手提供

关闭

用微信“扫一扫”