数据管理成企业智能化决胜关键，管理层如何释放生成式AI潜力|ai|企业智能化|大模型|应用程序|数据管理

麦肯锡公司最新报告显示，生成式人工智能有望每年为全球经济贡献高达4.4万亿美元。对于开发者和IT领导者而言，这无疑是一个千载难逢的机遇。

然而，当前超过半数的员工在使用AI技术时并未获得雇主的正式许可，他们迫切希望借助这些工具提升工作效率。值得注意的是，有32%的员工计划在不久的将来将生成式AI集成到自己的工作流程中，无论公司是否出台相关政策。这种现象凸显了员工对AI技术的热情以及组织可能面临的风险。

要充分发挥生成式AI的潜力，公司首先需要重视数据管理和准备工作。数据是驱动生成式AI理解和分析世界的关键，也是其实现变革性突破的基石。因此，建立健全的数据管理体系和策略至关重要。

此外，公司还需为大规模AI服务的构建和运营奠定基础，并确保生成式AI项目获得持续且明智的资金支持。在这场激烈的人工智能竞争中，迟缓的步伐可能导致失败。因此，公司必须在数据层面做好充分准备，同时有策略地扩大AI服务规模，并确保资金来源稳定可靠。

然而，如果我们忽视了数据管理的重要性或未能有效应对规模扩大和成本控制的挑战，那么生成式AI的巨大潜力可能会付诸东流。为了避免这种情况发生，数字经济应用实践专家骆仁童博士指出，我们需要积极探索改进数据管理方法的途径，并思考如何为长期支持生成式AI项目提供有力保障。只有这样，我们才能确保生成式AI在推动全球经济增长方面发挥出应有的作用。

AI的数据来源

AI的数据以多样的形态呈现，每种形态的数据都能在适当应用下丰富生成式AI的洞察力和质量。其中，结构化数据以其规则有序的组织方式脱颖而出，涵盖了产品详情、客户统计数据以及库存水平等各类信息。这种数据为生成式AI注入了坚实的事实基础，有助于提升响应的精准度。

除此之外，外部数据源也为内部结构化数据提供了有力的补充。天气预报、股市动态、交通流量等实时信息，为决策过程增添了真实世界的色彩。将这些数据融入生成式AI项目中，不仅能提供高质量的数据支持，还能避免自行生成这类数据所需的繁琐流程。

衍生数据则是另一种重要的数据形态。它通过对原始数据进行深入分析和建模得出，涵盖了客户意图、销售预测以及群体行为等方面的洞见。这些数据为生成式AI提供了更深层次的理解，有助于挖掘更具价值的信息。

然而，非结构化数据也不容忽视。与传统的报告或数据格式不同，非结构化数据包括图像、文档和音频文件等多种形式。它们捕捉到了人类沟通和表达的微妙之处，为生成式AI提供了独特的视角。生成式AI程序常常以此类数据为基础进行工作，将其作为输入和输出的常见选择。

但值得注意的是，数据隐私和网络安全问题在使用生成式AI时尤为突出。65%的公司表示，这是他们在使用生成式AI工具时面临的首要挑战。这些工具在收集和处理数据时，可能涉及到IP地址、浏览活动等敏感信息，存在被识别个人身份的风险。一旦数据处理不当或发生泄露，可能会造成严重的后果。

此外，深度伪造技术的兴起也加剧了人们的担忧。它能够在未经许可的情况下创建逼真的图像和声音，对社会稳定和个人权益构成威胁。同时，AI工具也使得犯罪分子能够制造更复杂的钓鱼邮件和恶意软件，加速网络攻击的进程。

因此，在使用生成式AI时，数字经济应用实践专家骆仁童博士强调，企业必须高度重视数据隐私和网络安全问题。定期评估网络安全策略，确保其与人工智能的发展保持同步至关重要。同时，采取强大的数据隐私措施如数据匿名化和加密等也是必不可少的。只有这样，我们才能充分发挥生成式AI的潜力，同时保障个人和社会的利益不受损害。

灵活型的大数据

在这个多元化的时代，各种各样的数据集散落在不同的环境中。为了让它们在生成式AI项目中发挥作用，关键是要构建一个实时的、多样化的数据景观，使其能够被轻松访问。此外，还需要对数据进行预处理，以便生成式AI系统能够有效地利用它们。嵌入使得生成式AI系统能够理解并使用数据，同时保留其意义和上下文。无论原始数据的形式如何，通过创建嵌入，我们都能让生成式AI系统超越简单的文本匹配，深入挖掘数据背后的意义和上下文。

通过这些嵌入，企业可以在所有数据上进行向量搜索或混合搜索，同时结合数据的价值和意义。然后，将这些结果汇总后传递给大规模语言模型（LLM）进行整合。通过从多个来源提供更多数据，而不仅仅依赖LLM本身，你的生成式AI项目就能为用户提供更准确、更可靠的结果，并大大降低虚构内容的风险。

要实现这一目标，必须选择合适的底层数据架构。在这个过程中，我们应尽量避免将数据分散在不同的解决方案中，形成碎片化的拼凑，因为每个这样的解决方案都可能成为一个需要长期维护、查询和管理的数据孤岛。相反，我们应寻求一种统一的数据架构，它能够无缝地集成数据，使生成式AI能够充分利用所有可用的数据频谱。这样，用户就能快速地向LLM提问并迅速得到回应，而不必等待多个组件逐一响应并由模型权衡其结果。这将极大地提高生成式AI的效率和准确性，为用户带来更好的体验。

AI模块化应用的优势

为了扩展生成式AI实施，需要在加快采用速度与保持对关键资产的控制之间取得平衡。采用模块化的方式来构建生成式AI代理可以使这个过程变得更容易，因为它可以分解实施过程，避免潜在的瓶颈。

类似于微服务设计在应用程序中的应用，AI服务的模块化方法也鼓励围绕应用程序和软件设计的最佳实践，消除故障点，并让更多潜在用户能够接触这项技术。这种方法还使得监控整个企业中AI代理的表现变得更容易，能够更精确地找出问题发生的位置。

模块化的第一个好处是可解释性，因为参与生成式AI系统的各组成部分彼此分离，这样就更容易分析代理是如何运作和作出决策的。AI通常被视为“黑箱”，而模块化使得跟踪和解释结果变得更加容易。第二个好处是安全性，因为各个组件可以通过最佳认证和授权机制进行保护，确保只有授权用户才能访问敏感数据和功能。模块化还使得合规和治理变得更容易。

类似的做法是将生成式AI视为企业自身运营的产品，而非单纯的软件。AI代理应作为产品来管理，因为这更能有效地体现其所创造的价值，并使整合、工具和提示方面的支持资源更容易获得。简化这种模式有助于在整个组织内普及对生成式AI的理解，促进最佳实践的采纳，并营造出共享专业知识和协作的生成式AI开发文化。

生成式AI具有巨大的潜力，各公司正竞相在其运营中实施新的工具、代理和提示。然而，要将这些潜在项目投入生产，就需要有效管理数据、奠定系统规模化发展的基础，并建立合适的预算模型以支持团队。合理安排流程和优先级将有助于你和你的团队释放这项技术的变革潜力。

关注ai带来的新挑战

最后，面对生成式AI工具，我们必须保持警惕。尽管这些工具在缺乏足够信息时仍会给出回应，但它们有时会编造答案，这要求我们在接收信息时不能只看表面，而要积极核实其有效性。事实上，60%的公司将此视为生成式AI的最大担忧，因为这可能引发声誉问题和其他严重后果。因此，AI算法的开发者应设定编造答案的比例或是否允许无答案的情况发生。同时，了解所使用工具的开发背景至关重要，以便确定组织可接受的误差范围。通常，将误差范围设为零是最佳选择，因为没有信息总比错误信息强。

版权和知识产权（IP）风险也是与生成式AI相关的重要问题。这些模型可能在受法律保护的材料上训练，并生成类似现有作品的内容。若用户未给予适当的信用，可能导致版权、商标或专利侵权。目前，法院正努力解决如何将知识产权法应用于AI生成的内容，但这需要一定时间。

因此，保护知识产权和培训员工批判性地思考他们输入AI工具的信息至关重要。明确规定哪些员工和合作伙伴可以访问公司的知识产权和敏感信息，并禁止特定材料和数据被输入AI模型。同时，教育员工如何合法地使用AI生成的内容以避免侵犯版权也是必不可少的。

随着生成式AI技术的不断发展，我们应保持关注并随时了解相关法律进展。虽然生成式AI带来了诸多挑战，但它也为我们带来了前所未有的效率和机会。AI技术预计每年将为全球经济增加4.4万亿美元的价值。为了充分利用这些益处，公司需要深入了解并有效管理AI的风险。从现在开始，让我们共同保护和推动业务的发展。

商道童言（Innovationcases）欢迎点赞和分享哦！~~

免费电子书： | | | |

数字经济应用实践专家骆仁童主讲课程

人工智能：

数字应用：

数字中国：

数字化转型：》

产业数字化：《》

宏观与趋势：