小贝子编程

使用 grep 查找所有重音单词(变音符)

本文关键字：单词音符 grep 查找使用 grep
更新时间 : 2023-09-08
英文 : Find all accented words (diacriticals) using grep?

我在文本文件中有一个很大的单词列表（每行一个单词）有些单词有重音字符（变音符）。如何使用 grep 仅显示包含重音字符的行？

对于更大的字符类（"哪些单词不是纯ASCII？"）我发现的最佳解决方案是使用带有-P选项的PCRE：

grep -P "[x7f-xff]" filename

这将找到 UTF-8 和 ISO-8859-1（5）（拉丁语 1、win1252、cp850）重音字符。

我有一个解决方案。首先使用"iconv"去除重音，然后对原始文件中的行执行"diff"：

cat text-file | iconv -f utf8 -t ascii//TRANSLIT > noaccents-file
diff text-file noaccents-file | grep '<'

最新更新

AWS Client VPN Access Public URL/IP
python dict get方法即使key在dict中也运行第二个参数
如何在Python中使用每周时间序列
Scss函数没有返回计算值
如何使用conduit获取一个lazy ByteString并将其写入文件(在恒定内存中)
c -内存分配器-简单隔离存储:你如何从它的地址推断分配块的大小?
获取JSON格式的Discord PY对象
如何为作为prop传入的React组件设置类型
在c++中使用new时是否按顺序分配内存?
你可以暂时复制谷歌云图像文件在Python?
PHP cURL 一个帖子但两次(双)它是相同的数据到数据库与 API
405 (Method Not Allowed)错误的ajax在Laravel 8
Sicstus:一个模块和CWD
Laravel在模型中有onethrough关系
Whiptail:当一个仪表正在运行时，我该如何处理一个错误?
关于Sacha Willems的示例代码的Vulkan屏幕外渲染问题
有人可以分解nums[i] = nums[i-1] + nums[i]做什么?(Python) &g
如何在 Qwidget 上绘制二维码，我在 Windows 10 上使用 Qt Creator C++
Fluentd td-agent.log文件大小持续增加
暂停javascript for循环，同时等待从突变观察者的响应?
Jetpack撰写更新广告横幅在Android视图
在ASP中构建级联下拉列表的问题. NET Core 7 MVC使用JQuery和ajax.googleapis.com
在EAS中找不到"expo dev client"错误所依赖的"expo devel la
需要帮助在文件之间本地共享Javascript变量
在Azure中删除自定义域失败
如何用谷歌电子表格正确阅读的R编写CSV
c -为什么在串行控制台的其他接口上使用UART ?
按字符串过滤数组
如何在响应式表单的ng-select中设置默认值
我希望条件只迭代映射函数，而不是渲染部分

使用 grep 查找所有重音单词(变音符)

相关内容

最新更新

热门标签：