Gabriele Bunkheila, MathWorks
数据集对人工智能模型至关重要。它们提供了我们用来训练人工智能模型的真相和用来衡量人工智能成功与否的测试。虽然研究人员倾向于重用众所周知的数据集,但构建现实世界系统的工程师必须创建能够代表人工智能模型运行的所有场景的数据集。这通常是一个迭代过程,需要特定于应用程序的资源、工具和专业知识。
在这节课中,我们将探索一个众所周知的实际例子:使用触发短语如“Hey Siri”或“OK谷歌”唤醒语音设备。我们将涵盖大量数据特定的最佳实践,重点是数据标记和注释、数据摄入、数据合成和增强、特征提取和领域转换。这个实际示例提供了可应用于广泛应用程序的一般注意事项。
你也可以从以下列表中选择一个网站:
选择中国网站(中文或英文)以获得最佳网站性能。其他MathWorks国家站点没有针对您所在位置的访问进行优化。