当一个人,组或程序决定在一个文档或文本中应该包含或排除哪些信息。它与围绕文档结构的概念有关,也与自然语言生成和计算语言学有关。每个研究领域都使用内容确定来检查如何选择信息。 内容确定包括将文本中的信息缩减...
当一个人,组或程序决定在一个文档或文本中应该包含或排除哪些信息。它与围绕文档结构的概念有关,也与自然语言生成和计算语言学有关。每个研究领域都使用内容确定来检查如何选择信息。

内容确定包括将文本中的信息缩减为最终文档的方式。当考虑在文档或文本中放入什么时,编辑者将进行他或她的研究或将得到所有可用的数据。内容确定包括将这些信息缩减成最终文档的方式。这是通过确定文本的角度或目标以及文本中与此相关的信息来完成的对内容决定的考虑是其风格。这往往取决于目标受众的性质。受众的智力和对主题的熟悉程度将改变所传递信息的词汇密度和复杂性。例如,学术界倾向于产生比八卦杂志更密集的文本其他的考虑因素包括格式的大小,无论是一本书、一篇文章还是一条短信。内容的每一种状态都是由一个人来决定的。有研究者和作者,他们通常是同一个人,但并不总是同一个人,然后是一个或多个编辑。每一个层次都对内容相关的内容有自己的看法本文的目的。计算语言学家和计算机工程师一直在寻找使用计算机程序而不是依靠人类来重现这个系统的方法。在内容确定方面,计算机采用了三种计算技术"图式技术"是以书面文本的检查为基础的。它使用预先检查过的文本作为基础,在生成的文本中包含哪些信息。"统计"方法根据大量的一般统计数据自动确定内容。"显式推理"使用人工智能(AI)检查和过滤信息。内容确定的总体目标是了解文件是如何产生的,以便用计算机复制。这样成功的结果将是计算机能够接收数据、过滤数据并生成最重要信息的摘要。计算机将以这些文件为基础而不是根据中国房理论,这可能意味着计算机能够理解数据,而不是能够复制和计算。