什么是 NLP (自然语言处理）

科技前沿 • 2025-03-20 12:55 • 阅读 33

什么是 NLP (自然语言处理）NLP 自然语言处理到底是做什么 NLP 的全称是 Natural Language Processing 翻译成中文称作自然语言处理它是计算机和人工智能的一个重要领域顾名思义该领域研究如何处理自然语言自然语言就是我们人类市场交流所使用的语音和字符系统就目前而言

大家好，我是讯享网，很高兴认识大家。

NLP（自然语言处理）到底是做什么？

NLP 的全称是 Natural Language Processing，翻译成中文称作：自然语言处理。它是计算机和人工智能的一个重要领域。顾名思义，该领域研究如何处理自然语言。

自然语言就是我们人类市场交流所使用的语音和字符系统。就目前而言，NLP所研究的对象，以字符系统——也就是我们通常说的“文字”——为主。

为什么要处理自然语言？

为什么要处理文字呢？因为有需求啊！

我们用文字描述事物、经历和思想。形成的文献资料，除了被阅读，往往还需要进行很多其他操作。

比如，被翻译成其他语种；对内容进行摘要；在其中查找某个问题的答案；或者，了解其中提到了哪些人事物，以及它们之间的关系如何，等等。

虽然所有这些需求，都可以通过人工阅读文献来解决，但“浩如烟海”的文献量导致人工文字处理的产能严重不足。

NLP 的发展历程

上世纪 40 年代计算机被发明，用机器而非人力来处理信息成为可能。早在 1950 年代，自然语言处理就已经成为了计算机科学的一个研究领域。

不过一直到 1980 年代，NLP 系统是以一套复杂的人工订制规则为基础，计算机只是机械地执行这些规则，或者做一些诸如字符匹配，词频统计之类的简单计算。

1980年代末期，机器学习的崛起为 NLP 引入了新的思路。刚性的文字处理人工规则日益被柔性的、以概率为基础的统计模型所替代。

近些年来，随着深度学习的发展，各类神经网络也被引入 NLP 领域，成为了解决问题的技术。

这里要注意了：自然语言处理（NLP）指以计算机为工具解决一系列现实中和自然语言相关的问题，机器学习、深度学习是解决这些问题的具体手段。 当我们关注 NLP 这一领域时，要分清本末，要做的事情是本，做事的方式方法是末。如果神经网络能够解决我们的问题，我们当然应该采用，但并不是只要去解决问题，就一定要用神经网络。

常见的 NLP 任务

NLP 要处理的问题纷繁复杂，而且每一个问题都要结合相应场景和具体需求才好讨论。

不过这些问题也有相当多的共性，基于这些共性，我们将千奇百怪的待解决 NLP 问题抽象为若干任务。

例如：分词、词嵌入、新词发现、拼写提示、词性标注、实体抽取、关系抽取、事件抽取、实体消歧、公指消解、文本分类、机器翻译、自动摘要、阅读理解等等，都是常见的 NLP 任务。

从 NLP 任务到技术实现

针对这些任务，NLP 研究人员探索出了很多方法，这些方法又对应于不同类型的技术。

在工作中，当我们遇到问题的时候，往往需要先将其对应到一个或多个任务，再在该任务的常用实现方法中选取一种适合我们使用的来执行任务。

【举个例子】：我们要基于若干文献构建一个知识图谱，知识图谱的两大核心要素是实体和关系，那么当然首先我们面临的任务就是从这些文献中抽取实体和关系。

实体抽取是一项非常常见的 NLP 任务，实现它的方法有多种，大体而言分为两个方向：

i）基于实体名字典进行字符匹配抽取；

ii）用序列预测模型进行抽取。

序列预测模型又可以选用机器学习模型，比如条件随机场（CRF）；或选用神经网络，比如 CRF+LSTM，或 CRF+BERT等。

具体选哪种方法呢？那就要看我们需要抽取的实体类型、文献类型和文献量了。

如果现在是从少量专业文献（例如论文、说明书、研究报告等）中抽取一些列专业名词表示的实体，那么用字典匹配方便直接代价小，可以一试。

如果是要从海量的各类文献中抽取一些通用的实体，那么借助模型则可能效果更佳。

具体用机器学习模型还是神经网络呢？这又和我们拥有的标注数据与计算资源有关，如果不差钱，想标多少数据，想训练多大模型都不在乎，上神经网络自然可以追求高准确率，但如果资源捉襟见肘，可能机器学习模型更加实用。

在线教程

麻省理工学院人工智能视频教程 – 麻省理工人工智能课程
人工智能入门 – 人工智能基础学习。Peter Norvig举办的课程
EdX 人工智能 – 此课程讲授人工智能计算机系统设计的基本概念和技术。
人工智能中的计划 – 计划是人工智能系统的基础部分之一。在这个课程中，你将会学习到让机器人执行一系列动作所需要的基本算法。
机器人人工智能 – 这个课程将会教授你实现人工智能的基本方法，包括：概率推算，计划和搜索，本地化，跟踪和控制，全部都是围绕有关机器人设计。
机器学习 – 有指导和无指导情况下的基本机器学习算法
机器学习中的神经网络 – 智能神经网络上的算法和实践经验
斯坦福统计学习

请添加图片描述

人工智能书籍

OpenCV（中文版）.(布拉德斯基等)
OpenCV+3计算机视觉++Python语言实现+第二版
OpenCV3编程入门毛星云编著
数字图像处理_第三版
人工智能:一种现代的方法
深度学习面试宝典
深度学习之PyTorch物体检测实战
吴恩达DeepLearning.ai中文版笔记
计算机视觉中的多视图几何
PyTorch-官方推荐教程-英文版
《神经网络与深度学习》(邱锡鹏-)
…

第一阶段：零基础入门（3-6个月）

新手应首先通过少而精的学习，看到全景图，建立大局观。 通过完成小实验，建立信心，才能避免“从入门到放弃”的尴尬。因此，第一阶段只推荐4本最必要的书（而且这些书到了第二、三阶段也能继续用），入门以后，在后续学习中再“哪里不会补哪里”即可。

第二阶段：基础进阶（3-6个月）

熟读《机器学习算法的数学解析与Python实现》并动手实践后，你已经对机器学习有了基本的了解，不再是小白了。这时可以开始触类旁通，学习热门技术，加强实践水平。在深入学习的同时，也可以探索自己感兴趣的方向，为求职面试打好基础。

第三阶段：工作应用

这一阶段你已经不再需要引导，只需要一些推荐书目。如果你从入门时就确认了未来的工作方向，可以在第二阶段就提前阅读相关入门书籍（对应“商业落地五大方向”中的前两本），然后再“哪里不会补哪里”。

在这里插入图片描述

小讯

零基础学会：黑群晖nas搭建与DDNS实现远程访问

上一篇 2025-02-20 19:39

2025年车辆转向不足转向过度个人总结_1

下一篇 2025-01-20 08:28

零基础学会：黑群晖nas搭建与DDNS实现远程访问 1736046317
随时随地可轻松赚钱的APP-自动赚钱宝 1736046317
2025年2024年本机一键验证登录最强指南已出，请查收！ 1736046316
每个销售员都需要掌握的获取新客户的9种方法 1736046316
2025年数字电子技术之逻辑门电路 1736046315
[已解决]安装CUDA失败报错(附万能解决办法) 1736046314
如何使用JIRA 1736046312
2025年卡尔丹公式简明推导 1736046312
2025年互相关（cross-correlation）及其在Python中的实现 1736046311
2025年车辆转向不足转向过度个人总结_1 1736046321
2025年Windows全局鼠标手势——MouseInc 1736046321
2025年802.11 bgn含义（速率标准） 1736046323
推荐一波对你来说，非常有用的网站，记得收藏 1736046323
2025年【速查表】之C语言关键字、转义字符、运算符、占位符、数据类型占用空间等(持续更新中...) 1736046324
2025年按键实验(GPIO输入) 1736046325
干货收藏 -关键词优化攻略！(附11款关键词检索工具） 1736046325
2025年DEFCON议题解读｜Dll劫持新思路——修改环境变量 1736046327
落花无声 1736046328

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请联系我们，一经查实，本站将立刻删除。
如需转载请保留出处：https://51itzy.com/kjqy/127044.html