“数据质量是成功采用人工智能的最大障碍”

6217

人工智能(AI)等新兴技术正以前所未有的速度在世界范围内发展。MathWorks深度学习营销经理Johanna Pingel讨论了学生、研究人员和工程师在与Ayushee Sharma互动中使用这些革命性技术准确解决复杂问题时可以遵循的良好实践。


Johanna Pingel,MathWorks深度学习营销经理
Johanna Pingel,MathWorks深度学习营销经理

选择合适的工具/环境来轻松与团队合作非常重要。但是在市场上有这么多选择,一个团队应该考虑哪些因素?

一个。关于人工智能工具和技术的讨论应该包括建模和模拟在整个工作流程中的作用。随着人工智能被训练与更多类型的传感器(imu、激光雷达、雷达等)一起工作,工程师们正在推动人工智能进入广泛的系统,包括自动驾驶汽车、飞机引擎、工业工厂和风力涡轮机。这些是复杂的、多领域的系统,其中AI模型的行为对整体系统性能有重大影响。

在这个世界上,开发人工智能模型不是终点;这仅仅是前进的一步。今天,设计师正在寻找支持基于模型的设计的工具,以模拟、集成和持续测试这些人工智能驱动的系统。基于模型的设计代表了一种端到端的工作流,可以降低设计人工智能驱动系统的复杂性。模拟让设计师能够理解AI如何与系统的其他部分进行交互。这种集成允许设计师在一个完整的系统环境中尝试设计思想。持续测试允许设计师快速发现AI训练数据集的弱点或其他组件的设计缺陷。

问:对于最终用户来说,可靠性是一个重要因素。数据科学家和其他开发人员应该采取哪些措施来确保可靠性?

一个。根据一些分析师的调查,数据质量是成功采用人工智能的最大障碍。我们知道训练和测试准确的人工智能模型需要大量的数据来确保系统的可靠性。虽然通常有大量用于正常系统操作的数据,但真正需要的是来自异常或关键故障条件的数据,以确保系统在所有条件下的行为都符合预期。对于预测性维护应用来说尤其如此,例如准确预测工业现场泵的剩余使用寿命。由于从物理设备中创建故障数据具有破坏性且成本高昂,所以最好的方法是从模拟故障行为中生成数据,并使用合成数据来确保准确的AI模型。

MATLAB是如何用于人工智能的?

一个。MATLAB支持从数据预处理到部署的完整人工智能工作流。机器学习和深度学习经验有限的团队仍然可以在MATLAB中成功地使用AI,方法是使用应用程序快速尝试不同的方法,并应用其领域专业知识来清理和预处理数据并创建AI模型。团队还可以利用人工智能专家构建的预先训练的人工智能模型和功能,利用他们拥有的数据快速构建其特定应用程序的原型。最后,他们可以将模型作为完整AI系统的一部分部署到嵌入式设备上。

问:测试和度量工具箱如何确保/合并不同供应商之间的互操作性?

一个。人工智能相关应用程序有很多工具,工程师和科学家最关心的一个问题是开发应用程序时的供应商锁定。互操作性确保团队可以在多个平台上设计和开发AI算法,并且仍然可以作为一个团队进行跨功能工作。通过MATLAB,从事AI项目的团队可以从许多开源平台导入AI模型,继续使用AI应用程序和可视化开发算法,然后将导入的AI模型部署到嵌入式或GPU设备。

想要在新兴技术中扮演角色的人有了巨大的增长。但如何才能缩小技能差距?

一个。随着人工智能在业界变得越来越普遍,更多的工程师和科学家——不仅仅是数据科学家——将从事人工智能项目。他们现在可以使用现有的深度学习模型和来自社区的可访问的研究,这比从头开始有很大的优势。虽然人工智能模型曾经大多是基于图像的,但现在大多数模型也纳入了更多的传感器数据,包括时间序列数据、文本和雷达。

工程师和科学家对数据的固有知识将极大地影响项目的成功,这是相对于不熟悉领域的数据科学家的优势。有了自动化标签等工具,他们可以利用自己的领域知识快速管理大型、高质量的数据集,这增加了准确的人工智能模型的可能性,从而提高了成功的可能性。


分享你的想法和评论

请输入您的评论!
请在这里输入您的姓名