有时,我们需要统计一篇英语小短文中每一个英文字母呈现的次数,这个用手工统计显然不成能完当作。即使共同电脑进行,也可能需要良多久。这时我们可以利用python编写一个小程序,很轻松的完当作这个工作。下面看我一步步操作。
第一步,先读入指心猿意马文件的内容。因为这个文件比力小,可以直接读入。若是文件较大,可以逐行或分部门读入内存。
第二步,对读入的文本将标点等特别符号、换行符、空格等替代为空。这一步比力主要,称为数据清洗,一般利用遍历+string.replace(old,new)来完当作。
第三步,将全文同一转换当作小写字母。这是为了便于统计,若是工作要求巨细写字母分隔统计,这一步可以不操作。
第四步,成立统计字典,对文本逐个遍历进行统计。利用字典get方式,已有的字母次数加上,没有字母写入字典。
第五步,按统计值进行排序。将字典键值对转化为列表,然后再对列表按值进行降序摆列。
第六步,按排序成果插手文本后面。利用追加的体例读入文件,然后遍历列表,将字母及对应成果写入文件。
0 篇文章
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!