小贝子编程

使用File::Slurp读取UTF8文件

本文关键字：UTF8 文件读取 Slurp File 使用 perl encoding fileslurp
更新时间 : 2023-08-20
英文 : Reading UTF8 files with File::Slurp

我尝试用Perl模块file::Slurp:

读取HTML文件

binmode STDOUT, ':utf8';
my $htmlcontent = read_file($file, {binmode => ':utf8'});

但是当我打印$htmlcontent变量时，由于法语重音或特殊字符，一些字符无法理解。

例如:"Plus d'actualitu00e9s"应为"Plus d'actualités"

我也检查了文件的编码，它是好的!

HTML document, UTF-8 Unicode text, with very long lines, with CRLF, LF line terminators

这个模块有问题吗?

谢谢

u00e9不是UTF-8字符，是JavaScript表示的Unicode字符。您需要使用Encode::JavaScript::UCS解码文件内容，例如

最新更新

实现客户端流到服务器Python代码失败
DllNotFoundException: agoraSdkCWrapper with Agora in Unity o
Rust narray:按列顺序遍历数组
如何加载存储在同一DAT文件中的多个python对象?
代理跨域请求与angular——proxy.config
属性错误："函数"对象没有属性"args"
OpenGL/glm显示黑屏
我收到此警告标志数组索引 4001 已超过数组的末尾(包含 4001 个元素)
Spring Content 1.2.5 JPA(Postgres) .docx文件突变为zip归档
将十进制转换为十六进制，并确保它们是数字
为用户在登录页面后添加路由
动态变量导致错误，因为它没有正确分配
有可能从手机中获得指纹或人脸验证吗?
File IO From a JAR File
如何获得上下文在一个简单的类没有BuildContext在扑动
无法向 Tkinter 窗口添加背景
如何将RGB图像转换为灰度，但保持一种颜色?——Java
我应该在Docker内部还是在虚拟环境中安装气流?
属性错误： 'DataFrame'对象没有属性'assign'
如何在每次在DirectoryInfo.GetFiles()中加载新文件时执行操作?
HTML中的Javascript在Angular中不起作用
如何在firebase中调度大约每整小时运行一次的函数?
Uncaught TypeError:不能访问数组上字符串类型的偏移量
Switch(Select)在TRANSFORM和Select之间工作吗?
MySQL SELECT查询工作，但具有相同WHERE子句的UPDATE查询不工作
drupal 10 localhost站点:如何在安装和注销后访问登录页面
Flutter原生启动画面图像未出现- Flutter (Dart)
用另一个远程分支覆盖一个远程分支
邮递员说"The route api...could not be found."(拉拉维尔)
Firebase Messaging项目Google Analytics升级失败

使用File::Slurp读取UTF8文件

相关内容

最新更新

热门标签：