当前位置: 首页 > news >正文

^M 字符处理

windows用的是\r\n来做分行的linux是\n

一、文本格式转换中的^M符号

  1. 跨平台文本文件

    • 当在Windows系统下编辑的文本文件被转移到Unix/Linux系统下打开时,由于Windows系统使用CR+LF(\r\n)作为行结束符,而Unix/Linux系统使用LF(\n)作为行结束符,因此可能会出现M这种特殊形式出现。
  2. 文本编辑器设置

    • 在某些文本编辑器(如Vim)中,如果编辑器被配置为识别Unix格式的文件,但打开的文件实际上是Dos格式的(即使用CR+LF作为行结束符),那么编辑器可能会将CR字符显示为^M。

二、历史和技术背景

  1. 打字机时代

    • 在计算机诞生之前,打字机使用两个字符来开始一个新行:首先是回车(CR),将打印头移回行首;然后是换行(LF),将纸张向上移动一行。这两个动作分别对应着\r和\n字符。
  2. 计算机存储

    • 在计算机存储成本高昂的年代,为了节省存储空间,一些系统(如MS-DOS和早期的Windows)选择了沿用打字机的回车换行传统,使用CR+LF作为行结束符。
  3. 编辑器识别

    • 现代文本编辑器(如Vim)通常能够识别并处理不同格式的行结束符。但是,如果编辑器的设置与文件的实际格式不匹配,就可能会出现^M这样的特殊表示。

三、解决方法

  1. 修改编辑器设置

    • 在Vim中,可以通过设置fileformats选项来指定编辑器能够自动识别的文件格式集合。例如,将fileformats设置为unix,dos,这样Vim就可以自动识别并处理Unix和Dos格式的文件了。
  2. 使用转换工具

    • 可以使用如dos2unix这样的工具将Windows下的文本文件转换成符合Unix/Linux系统要求的文件。
  3. 手动替换

    • 在文本编辑器中,可以使用全局替换功能将^M符号(实际上是CR字符)替换掉。在Vim中,可以使用:%s/\r//g这样的命令来全局替换CR字符。
  4. dos2unix <文件名>
  5. 读取后做最后一个字符的值判断处理

综上所述,^M符号主要在跨平台文本文件传输和编辑器设置不匹配时生成。了解这一点有助于我们更好地处理文本文件中的行结束符问题。


http://www.mrgr.cn/news/63385.html

相关文章:

  • TELERAD公司介绍
  • 免杀对抗—反VT沙盒虚拟机反调试进程APC注入
  • 开源协议类型及长安链开源协议介绍
  • StringBuilder为何比String节省效率
  • 【flink】之新版本kafka到kafka
  • Redis ——发布订阅
  • GaussDB Ustore存储引擎解读
  • Google Play商店中的类似应用:它们对ASO优化重要吗?
  • go-zero 的使用
  • 探索医学数据:使用Seaborn的成对关系图揭示变量间的关联
  • Leetcode 62. 不同路径 动态规划+空间优化
  • 【文本情感分析识别】Python+SVM算法+模型训练+文本分类+文本情感分析
  • vxe-table v4.8+ 与 v3.10+ 虚拟滚动支持动态行高,虚拟渲染更快了
  • 低代码技术:加速企业数字化转型的利器
  • 河南高校大数据实验室建设案例分享
  • 第十九章 特殊工具与技术
  • 10 P1094 [NOIP2007 普及组] 纪念品分组
  • Nginx 文件名逻辑漏洞(CVE-2013-4547)
  • ctfshow--xss靶场web327-web333(一命速通不了的靶场)
  • 法律文件智能识别:免费OCR平台优化数字化管理
  • 基于Springboot+Vue的流动摊位管理系统 (含源码数据库)
  • 哈尔滨华时信息技术有限公司员工赴深圳培训提升流程
  • 第三份代码:VoxelNet的pytorch实现
  • 江协科技STM32学习- P30 FlyMCU串口下载STLink Utility
  • 企业电子招投标采购系统——功能模块功能描述+数字化采购管理 采购招投标
  • 数字化浪潮中,Vatee万腾平台驱动企业革新前行