统计词频

cat words.txt | tr -s " " "\n" |sort |uniq -c | sort -r -n | awk '{print $2,$1}'
tr -s 将重复出现字符串压缩为一个字符串
“ “ “\n” 将空格替换为换行
uniq 命令删除文件中的重复行。uniq 命令读取由 InFile 参数指定的标准输入或文件。该命令首先比较相邻的行,然后除去第二行和该行的后续副本。重复的行一定相邻。(所以一定要在发出 uniq 命令之前,请使用 sort 命令使所有重复行相邻。
sort -n按照数值排序
sort -r降序排序
sort file.txt | uniq -c -c或–count在每列旁边显示该行重复出现的次数

另:
删除字符asd
tr -d ‘asd’
删除空行
tr -s ‘\n’
sort -u 去重,如果只有sort是不会去重
sort file.txt | uniq -u -u或——unique:仅显示出一次的行列;只显示单一行
sort file.txt | uniq -d -d或–repeated:仅显示重复出现的行列