文本文件是一种计算机文件,它将键入的文档存储为一系列字母数字字符,通常没有视觉格式信息。内容可以是个人笔记或列表、日记或报纸文章、书籍,文本文件与文字处理文件相似,两者的内容主要是文本;它们的不同之处在于文本文...
文本文件是一种计算机文件,它将键入的文档存储为一系列字母数字字符,通常没有视觉格式信息。内容可以是个人笔记或列表、日记或报纸文章、书籍,文本文件与文字处理文件相似,两者的内容主要是文本;它们的不同之处在于文本文件通常不记录诸如字符样式、大小、页码等信息,一些计算机操作系统在文本文件和二进制文件之间作了基本的区分,它由计算机直接解释。

ASCII编码系统以其适应性和简单性而闻名。
在大多数用于文本编码的方案中,每个字符都被分配一个数值,然后文本被写成二进制数的字符串。有一种编码模式,称为美国信息交换标准码(ASCII),在计算机历史的早期就成为一种广泛使用的标准,尽管它对英语以外的语言的支持很差,但ISO 8859代码系列为基于拉丁字母和类似字母的语言提供了更好的支持,但无法对来自东亚语言(如日语)的字符进行编码,从而导致不兼容标准的激增。
最近,Unicode®联盟一直在开发一种编码系统,名为
Unicode®,其目标是为地球上每种语言中使用的每个字符分配一个唯一的数字这将允许每种语言使用一个代码,并允许多种语言的文本出现在一个文件中。Unicode的第一部分基于ISO 8859,而ISO 8859本身就是基于ASCII的。使用Unicode®甚至在英语国家也有优势,由于使用旧模式编码的文本在从一个系统移动到另一个系统时可能会显示出轻微的不一致性。
文本文件的优点包括小尺寸和多功能性。比以其他格式存储的相同数据小千字节或兆字节,它们可以通过电子邮件或磁盘进行快速和大规模的交换。大多数文件可以在运行不同操作系统的计算机上打开,使用非常基本的软件。主要的缺点是缺乏格式。对于表示包含图像或依赖设计元素来传达其信息的文档,文本文件可能不是一个很好的选择意思——例如,包含表格数据、数学公式或具体诗歌的文件。
文本文件通常是供人类阅读和编辑的,但并非所有的文件都包含主要供人类使用的内容。大多数编程代码在编译之前都存储在文本文件中,即翻译文件还可能包含机器可读的文本标记,这些标记除了提供纯文本外,还可以提供格式信息。例如,超文本标记语言(HTML)文件可以在文本编辑器中作为纯文本文件打开,或者在被web浏览器解释后显示为格式化的网页。类似的方案包括用于布局科学论文的LaTeX和用于结构化数据的可扩展标记语言(XML)。