一聚教程网:一个值得你收藏的教程网站

热门教程

asp.net 汉字转换成无声调标注的拼音

时间:2022-06-25 04:13:41 编辑:袖梨 来源:一聚教程网

由于汉字拼音转换表资源比较宝贵的缘故,网络上开源的转换程序

比较少。另外,网络上给出的码表,可能不能覆盖全部的多音字,

生僻字,所以基于此类码表写成的程序,也就有一定的局限性。
  本文给出一份完毕的,将汉字转换成无声调标注的拼音的设计思

路、全部代码并且给出一份在一定程度上可用的汉字拼音转换表
void StringManipulation::FormatPinYinMap

(map>&hptable)
{
 ifstream ifile("mycodebook.txt");
 
 string line;
 while (getline(ifile,line))
 {
  if (!line.empty())
  {   wstring wsResult=String2Wstring(line);
   vector goodWordstemp;
   boost::split

(goodWordstemp,wsResult,boost::is_any_of(" "));
   wstring mykey=goodWordstemp[0];
   vectormyval;
   for(vector::iterator

it=goodWordstemp.begin()+1;it!=goodWordstemp.end();it++)
   { 
    myval.push_back

(Wstring2String(*it));
    

 

   }
   if (!hptable.count(mykey))
   {
    hptable[mykey]=myval;
   }


  }

 

 

 }

}


单个汉字转换拼音的代码

vectorStringManipulation::HZ2Py(wstring

character,map >& hptable)
{

 vectorcandidates;
 if (hptable.count(character))
 {
  candidates=hptable[character];

 }
 else
 {
  candidates.push_back("[A-Z]+");

 }
 return candidates;

}

获得一汉字字符串的拼音串


/*********************************************************

***************/
/*获得一汉字字符串的拼音串                                

                                    */
/*********************************************************

***************/
vector StringManipulation::Han2Py(string

shan,map>&hptable)
{
 vectorresult;
 GraphRepresentation gr;
 gr.Vertex[0]="@";
 int mycount=0;//是否添加“正则边”
 int prevsize=0;//上一个汉字有几个读音
 int laslabel=0;//上一次节点编号的最大值
 if (!shan.empty())
 {
  wstring whan=String2Wstring(shan);
  for (wstring::iterator it=whan.begin

();it!=whan.end();it++)
  {
   wstring tmp;
   tmp.assign(1,*it);
   vectortmpcandidates=HZ2Py

(tmp,hptable);
   if(mycount==0)
   {
    for (int

i=0;i     {
     gr.Vertex

[i+laslabel+1]=tmpcandidates[i];
     gr.GraphR

[make_pair(0,i+laslabel+1)]="&";

    }
    

prevsize=tmpcandidates.size();
    

laslabel=tmpcandidates.size();

   }
   else
   {
    for (int

i=0;i     {
     gr.Vertex

[i+laslabel+1]=tmpcandidates[i];
     for (int

j=laslabel;j>laslabel-prevsize;j--)
     {
      gr.GraphR

[make_pair(j,i+laslabel+1)]=".*?";
     }
     

    }
    

laslabel+=tmpcandidates.size();
    

prevsize=tmpcandidates.size();
    

 


   }
   mycount++;

  }
  gr.Vertex[laslabel+1]="@";
  for (int j=laslabel;j>laslabel-prevsize;j

--)
  {
   gr.GraphR[make_pair

(j,laslabel+1)]="&";
  }
  vector>paths;
  gr.GetPaths(paths,0,laslabel+1);
  for (vector>::iterator

it=paths.begin();it!=paths.end();it++)
  { 
   dequetmpque;
   string singlecandidate;
   for (vector::reverse_iterator

rit=it->rbegin();rit!=it->rend();rit++)
   {  
    tmpque.push_back(*rit);
    
    if (tmpque.size()==2)
    {
     int

tmp1=tmpque.front();
     tmpque.pop_front

();
     

singlecandidate+=gr.Vertex[tmp1];
     int

tmp2=tmpque.front();
     string

edge=gr.GraphR[make_pair(tmp1,tmp2)];
     

singlecandidate+=edge;
     

    
    }
    
    
     
    
    
  } 
   TrimString(singlecandidate,"@");
   TrimString(singlecandidate,"&");
   result.push_back(singlecandidate);
  }

 

 }
 
  return result;
 
}

热门栏目