人工智能如何解决文书工作问题

自动化数据提取可能不像聊天机器人那样性感，但它具有提高生产力的巨大潜力。

我们都知道人工智能在 Netflix 推荐和模仿客户服务代理的聊天机器人中的范式改变使用。但是，处理发票和从合同、租约、税表、调查和其他文件中提取详细信息的日常业务又如何呢？人工智能 (AI) 提供了更有效地执行这些复杂、集成任务的方法。使用各种创新的人工智能技术，组织可以更快地处理文档并简化操作程序；更少的错误意味着更少的更正和撤稿。普华永道最近对自动化分析的研究发现，即使是最基本的基于人工智能的提取技术也可以为企业节省 30-40% 的通常用于此类流程的时间。对于每年以每页三分钟的速度处理 100,000 页文档的中型公司，完成任务大约需要 5,000 人小时；每小时 50 美元，即 250,000 美元。实施用于数据提取的 AI 解决方案可以为每处理 100,000 个页面节省 2,000 小时。企业应抓住这一潜力，将耗时且容易出错的流程自动化，并发掘有助于长期增长的新见解。

是时候为无聊的 AI 感到兴奋了

处理发票是业务运营的基本和关键组成部分。但这是一个艰难的过程。每个供应商都有自己的怪癖，每张发票都有自己的命名法——一家公司的“付款期限 15 天”是另一家公司的“两周后付款”。即使每个月都来自同一个供应商的发票，采购代理也会发生变化，格式会发生变化，并且拼写错误也会出现。当然，发票只是文档冰山一角。每天，在每家公司，在管理和运营的各个级别，员工都需要从合同、租约、税表、调查和其他文件中提取详细信息。

好消息？人工智能 (AI) 提供了更有效地执行这些复杂、集成任务的方法。这些解决方案无缝且可扩展、操作简单且易于管理。使用各种创新的人工智能技术，组织可以更快地处理文档并简化操作程序；更少的错误意味着更少的更正和撤稿。普华永道最近对自动化分析的研究发现，即使是最基本的基于人工智能的提取技术也可以为企业节省 30-40% 的通常用于此类流程的时间。

我们都知道人工智能在 Netflix 推荐中的范式变化使用、模拟在线客户服务代理的聊天机器人、酒店房间的动态定价以及为送货公司创建路线。这些努力是无数大型成功公司的价值创造引擎。我们在这里谈论的是一种明显不那么引人注目的，从表面上看，更多地使用人工智能——它的目的是降低成本和优化运营，而不是改变或创造行业。但这个无聊的人工智能实际上是非常令人兴奋的，因为它面临着所有公司都在努力解决的问题，并且因为生产力（以及因此利润率和估值）的收益是真实的。

然而，尽管潜力巨大，普华永道的《2021 年人工智能预测》发现，只有 28% 的高管优先使用人工智能和机器学习进行信息提取，远低于聊天机器人和工作场所安全解决方案等其他用途。一些领导者可能对开发、扩展和整合这些先进技术所需的时间和资源感到不知所措。有些人会对信任人工智能犹豫不决，或者对其效用持怀疑态度。其他人可能只是忽略了自动信息提取的价值，因为它是一种后台功能。无论出于何种原因，他们都错失了简化流程和提高投资回报率的机会。

28% 的高管优先使用人工智能和机器学习进行信息提取。

文书工作问题

任何审计客户账簿的公司每年都要花费大量时间来收集证据和核实交易，以确认与客户财务报表相关的余额和交易是正确的；这被称为“细节测试”。近三十年来，工作人员一直使用电子表格（首先是 Lotus 1-2-3，然后是 Microsoft Excel）作为完成细节测试的主要工具。

如今，这些审计的证据通常以 PDF 格式出现——发票、对账单、收据——并且可能长达数千页。这些 PDF 上的信息必须手动输入到电子表格中。对于一家每年以每页 3 分钟处理 100,000 页文件的中型公司来说，完成这项任务大约需要 5,000 人小时；每小时 50 美元，即 250,000 美元。

现在，如果同一家公司可以部署增强智能呢？这是基于由机器学习驱动的自适应系统的应用程序的术语，其中算法从人类经验中学习，但人类做出最终决定。AI 工具可以“读取”每张发票上的文本，并使用关系数据搜索来快速识别组织之前标记为重要的支持文档——这是尝试管理数百万张发票异常时的强大快捷方式。尽管纸质发票可能对每个供应商都是唯一的，但人工智能技术可以识别不同发票中的重要字段，例如单位成本和数量，并自动计算分类账余额。通过实施 AI 解决方案并假设上述 40% 的估计值，示例中型公司每处理 100,000 个页面可以节省 2,000 小时。

即使采用了最基本的基于人工智能的提取技术，处理日常文书工作所需的时间也减少了 40%。

普华永道，数字智能：如何让您的分析功能更高效、更具成本效益

许多公司的另一个问题是需要解释和回应政府税收机构向个人和公司发出的税务通知或信件。在美国，联邦政府有 100 多种此类税务通知，个别州还有数千种：账户变更、付款请求、纳税申报差异。在任何情况下，都需要有人阅读信件或通知，对其进行解释，验证其准确性和适用性，对其进行分类，最后做出回应。这是一个具有挑战性的过程，容易出错。除了涉及典型的数据输入错误外，这些类型的文档还可能在混乱中丢失，从字面上看，导致错过通知、延迟响应以及数千个额外的工作时间来纠正这种情况。

作为鼓励员工主导的自动化工作的内部企业范围计划的一部分，普华永道使用增强智能来阅读和响应税务通知。该工具读取许多不同类型的表格，并提取和理解需要特定操作的术语和短语，例如到期日、通知代码、欠款、未提交处罚等。然后，该工具使用自然语言生成技术自动创建响应，无需手动创建响应。结合其他信息提取工具，以及合规、情景规划和国际税务情况的解决方案，普华永道将执行这些不同任务通常所需的时间减少了超过 500 万小时，节省了 16%。

当人类抽查此类税务通知时，这是一种增强智能。但是，当自动发送响应时，它就是自主智能——一种既具有自适应性又可以自行做出决策的人工智能系统，无需人工参与。（这两种方法都有效；它们适用于不同的领域，具体取决于风险承受能力。）实施高级模式匹配技术的公司可以自动识别可能导致他们收到特定通知的趋势——例如在同一部分添加相同的错误信息税表——从而避免将来出现此类通知，从而节省更多时间和资源。

数字数据，例如从调查中收集的详细信息，也遇到了手动分析的问题。例如，当一家公司进行员工调查时，必须有人对结果进行统计和分析。但即使调查是在线完成的（而不是通过纸笔回答，这会带来数据输入错误的重大风险），也必须有人编译、分析和总结数据。这项任务经常委派给具有基本统计知识和经验的初级分析师，也是一个不准确的雷区。变量之间的关系可能是虚假的，但却被宣布为重要且具有变革性——导致有缺陷的结论助长错误和不可靠的策略。一个典型的例子：冰淇淋销售通常与犯罪呈正相关。当然，冰淇淋销售不导致犯罪（反之亦然）——只是在炎热的夏季天气两者都会上升。

但是，比较群体、将受访者分类以及检查显着差异都可以自动化。此外，对于“免费回复”的回答，例如“您对我们如何提高员工福利有任何其他想法吗？” 自然语言处理技术可以识别受访者回答中的重要或突出主题，总结要点并生成自动报告，从而减少手动阅读对数十个问题的数百或数千个回答的需要。对于上述关于福利的问题，它可以识别出集中在医疗保健、灵活性、人寿保险等方面的回答。尽管如此，这些人工智能系统的静态推荐——一种辅助智能——仍然需要人类的判断和决策。

贸易工具

人工智能驱动的信息提取可以解决上述场景中的许多低效率和地方性问题。然而，与制造中使用的进行点焊或喷漆的机器人不同，支持人工智能的信息提取不是一种死记硬背的常规活动。它需要一系列复杂的数据科学技术，涉及必须适应不断变化的条件的多个动态组件。将光学字符识别 (OCR)、监督机器学习和自动分析等尖端技术集成到无缝流程中，需要时间和技术专长。

考虑一下 OCR，它能够读取页面上的打印字符（甚至是手写字符），无论字体、大小、方向和亮度如何。目前，我们经常遇到这种技术，即使用手机自动存入支票，此时 OCR 不仅读取路由号码和帐号，还读取支票金额和日期。OCR 是一项较旧的技术，但作为从相关文档中收集相关数据的过程中的第一步，它仍然是必不可少的。

对于许多用途，将这些数据转化为行动需要能够识别和分类模式的复杂机器学习算法。机器学习算法可以在现有数据上进行校准以调整其参数，然后释放到新数据上。它们可以被校准以识别复杂而微妙的货币欺诈指标的模式，例如贷款申请的拼写错误信息或过多的转账或现金存款。它们还可以在不同的法律合同中挖掘出相似的含义，例如在排除、限制和赔偿条款中，这些条款都与豁免有关。

此外，机器学习算法可以处理数据集并将一组实体分类为不同的组。自动客户细分就是其中一个众所周知的例子，但对税务通知、信件或合同条款进行分类也是可能的，并且可以节省大量时间，否则这些时间会花在阅读这些文件上。

在过去的几年里，自然语言处理的进步令人印象深刻。尽管不需要使用最先进的算法，例如自然语言生成应用程序 GPT-3，但支持 AI 的信息提取仍然可以通过识别文档的真正“含义”来利用其中的一些进步，通过识别语境词、词性等。人工智能本身不理解它在说什么（尽管它可能看起来那样），但算法能够生成文档摘要；确定主题；判断散文的情绪（正面或负面）；识别文件中的关键条款、规定或条款；并确定需要类似操作的文档组。

结合这些人工智能技术，可以快速轻松地阅读和总结来自第三方、竞争对手或内部来源的长文档，并产生快速和适当的响应。在一个应用程序中，我们在各种文档类型（例如贷款和衍生品）中搜索 35 个不同的概念术语（例如，“管辖法律”或“终止日期”），我们最初只使用五个文档训练 AI 系统，然后获得了 0.28 的 F1 分数。F1 分数是在数学上将假阳性、假阴性和真阳性组合成一个分数的准确度度量；一个完美的 F1 分数是 1，而一个毫无价值的 F1 分数是 0。随着时间的推移，565 个文档的进一步训练将 F1 分数提高到 0.83——不是完美的，但相当不错。

每个新文档都提供了更多的上下文——算法可以在这些示例上训练其参数并提高其准确性的更广泛的示例。但是，应该注意的是，不能仅通过 F1 分数来衡量准确性（例如，F1 分数为 0.60 的模型可能会准确地产生业务所需的结果）。F1 分数应该是一个指导，但最终，人类的判断和专业知识将验证模型及其准确性水平。

人工智能分类

当简单、重复的任务被固定并且没有任何人工参与时，就会出现自动化智能。
辅助智能需要人的判断和决策，但人工智能系统提供的建议不会改变。
增强智能侧重于由机器学习驱动的自适应系统，其中算法从人类经验中学习，但最终决策由人类完成。
自主智能是指人工智能系统既具有适应性又可以自行做出决策，无需人工参与。

人的因素

人工智能工具往往非常准确，但当它们确实出错时，它们可能是荒谬的，而且非常奇怪。在实施这些 AI 技术期间保持人工监督对于确保质量至关重要，无论是模型训练还是下游流程中输出的最终校正。因此，成功实施需要的不仅仅是购买工具。公司还需要采取以下行动：

创建一个新平台（或重新配置现有平台），结合数据管理、自动化工具和人工智能应用程序，同时让人们参与其中。该平台可以是一个中央企业级门户，可以在其中存储和交换数据，上传和下载应用程序，并通过通信接口鼓励协作和联合开发。该平台应该可供组织中的每个人访问，并且应该接受员工主导的创新和应用程序以及来自专业开发人员的创新和应用程序。当然，这些强大技术的民主化应该负责任地进行；领导者必须对潜在风险保持警惕，并认识到适当培训和公司治理的必要性。

制定一个专注于数字和分析理解和意识的企业范围的培训计划。从 CEO 到最新的入门级员工，每个人都需要提高技能，涵盖所有职能。公司应该考虑培训这些员工中的许多人，不仅要使用这些节省时间的信息提取工具，还要了解它们背后的人工智能技术的基础知识。通过更好地了解人工智能的能力、风险、局限性和假设，员工将更好地了解如何负责任和有效地使用这些工具。每个组织都应确保其员工熟悉当前的技术，而这种转变只有在整个员工队伍都参与进来的情况下才会生效。

特别注意对中层管理人员的影响，他们的大部分日常任务将基本上被取消。这是自动化的现实——它通过接管目前由人类完成的一些任务来提高效率。与管理人员交流的重要信息是，通过这样做，人工智能将使他们能够专注于更难解决的问题，并致力于解决需要人类判断或创造力的问题——进行更多的管理，减少令人麻木的重复任务。

热情地为那些在战术层面使用这些工具和新平台的人提供激励，而不仅仅是引用有关潜在投资回报率的事实。这些激励措施取决于企业文化，但可能包括绩效评估的 KPI、实时奖金、中奖彩票等。激励这些工具的初始使用可能会加速它们的接受度。当人们开始看到这些工具如何提高他们的生产力时，他们就会被说服。

通过指定自上而下的拥护者来促进文化变革，这些拥护者始终如一地、频繁地传达人工智能实施的好处。使用这些工具符合战略、受到好评、不仅有利于组织的客户而且有利于组织的健康和成长的信息将加速采用，并使技术和文化变革持续下去。

作为人工智能的一种应用，信息提取可能看起来很平凡，但仔细观察会发现恰恰相反。借助自动化或增强型解决方案，企业有可能为传统上耗时且容易出错的流程注入活力，发现提高速度和效率的机会，并释放有助于长期增长的新见解。无聊似乎从未如此令人兴奋。

Robert N. Bernard是普华永道实验室的智能企业主管。他拥有超过 25 年的高级分析和人工智能开发经验，并在多个行业制定分析战略，包括国家安全和算法投资。他居住在新泽西州北部，是普华永道美国的董事。

Anand Rao是普华永道的人工智能全球领导者和美国分析实践的创新领导者。他拥有博士学位。悉尼大学人工智能博士，曾任澳大利亚人工智能研究所首席研究科学家。他常驻波士顿，是普华永道美国的负责人。

普华永道美国负责人 Jacob T. Wilson 和 Joe Harrington 也对本文做出了贡献。他们领导普华永道实验室内的美国人工智能实验室，并帮助领导了这家美国公司信息提取平台的创建。

来源：https://www.pwc.com/gx/en/issues/the-leadership-agenda/how-ai-can-crush-the-paperwork-problem.html

NLPAI.Tech

人工智能如何解决文书工作问题

作者自然语言处理人工智能科技

是时候为无聊的 AI 感到兴奋了

文书工作问题

贸易工具

人的因素

作者自然语言处理人工智能科技

促销域名

NLPAI.Tech

人工智能如何解决文书工作问题

作者自然语言处理人工智能科技

是时候为无聊的 AI 感到兴奋了

文书工作问题

贸易工具

人的因素

作者自然语言处理人工智能科技

促销域名

goStart.Ltd

¥250

StartGo.Ltd

¥250

ZhiKeCorp.com

¥75,000

WeHave.Top

¥15,000