Lesson 2 – Intro to Cognitive Services

MSFTImagine
28 Jan 202203:13

Summary

TLDR视频脚本介绍了一个三步AI开发流程,强调了数据收集的重要性,并以医疗领域为例,探讨了如何利用微软认知服务中的API(如面部识别、计算机视觉、语音转文本和翻译API)来解决医院候诊室等待时间长的问题。通过这个例子,脚本展示了如何选择合适的API来帮助AI收集和处理数据。

Takeaways

  • 🧠 人工智能(AI)的基础是数据收集,模仿人类通过视觉、听觉等感官接收信息。
  • 🛠️ 微软开发了认知服务工具,帮助开发者将数据输入AI系统。
  • 🔍 认知服务分为五个类别:视觉、语音、语言、搜索和决策。
  • 🔧 每个类别下都有APIs(应用程序编程接口),用于构建AI系统。
  • 🏥 通过创新AI应用,例如AI在医疗领域的应用,可以解决实际问题,如医院候诊室的长时间等待。
  • 👁️ 使用面部识别和计算机视觉APIs来分析病人的面部信息。
  • 🗣️ 利用语音转文本APIs来获取病人描述自己病情的语音信息。
  • 🌐 为了提高包容性,可以使用翻译API来理解不同语言的病人。
  • 📝 AI开发第一步是确定我们希望找到和接收的数据类型以及我们将使用的APIs。
  • 🔥 通过结合不同的APIs,可以开始确定AI如何收集数据。
  • 🚀 创新AI应用能够提高效率,改善服务,如通过AI医院入口系统来检查病人并评估病情。

Q & A

  • 人工智能的第一步是什么?

    -人工智能的第一步是确定我们希望收集的数据,这是构建AI的基础。

  • 微软开发的工具集名称是什么?

    -微软开发的工具集称为微软认知服务(Microsoft Cognitive Services)。

  • 微软认知服务包含哪五个类别?

    -微软认知服务包含五个类别:视觉(Vision)、语音(Speech)、语言(Language)、搜索(Search)和决策(Decision)。

  • API代表什么意思?

    -API代表应用程序编程接口(Application Programming Interface)。

  • 在构建AI时,API的作用是什么?

    -API在构建AI时的作用类似于建房子时使用的工具,如锤子和锯子,它们是构建AI不可或缺的工具。

  • 如何使用API来解决医院候诊室等待时间长的问题?

    -可以通过构建一个AI医院入口系统,使用面部识别和计算机视觉API来检查患者状况,使用语音转文本API来接收患者描述的病情,以及使用翻译API来理解不同语言的患者。

  • 为什么在AI医院入口系统中要使用面部识别API?

    -使用面部识别API可以帮助从患者的面部捕捉到一些关键信息,比如可能的健康问题或情绪状态。

  • 语音转文本API在AI医院入口系统中扮演什么角色?

    -语音转文本API可以将患者口头描述的病情转换成文本信息,便于AI系统分析和处理。

  • 为什么AI医院入口系统可能需要翻译API?

    -翻译API可以帮助AI系统理解并服务于使用不同语言的患者,提高系统的包容性和可用性。

  • 在AI开发过程中,如何确定要使用哪些API?

    -在AI开发过程中,需要根据希望解决的问题和所需收集的数据类型来确定使用哪些API。

  • 为什么说微软认知服务使得AI开发变得更容易?

    -微软认知服务提供了一系列的API工具,这些工具可以帮助开发者更容易地将数据集成到AI系统中,简化了开发过程。

Outlines

00:00

🤖 AI开发入门:数据收集与微软认知服务

本段介绍了AI开发的基础过程,强调了数据收集的重要性。类比人类通过感官接收信息,AI也通过类似的方式获取数据。微软的认知服务(Microsoft Cognitive Services)为AI开发者提供了便利,包括五个类别:视觉、语音、语言、搜索和决策。这些服务通过APIs(应用程序编程接口)实现,类似于建筑工具。通过一个创新的AI医疗概念案例,展示了如何选择合适的APIs来收集数据,例如面部识别、语音转文本和翻译APIs,以解决医院候诊室等待时间长的问题。

Mindmap

Keywords

💡人工智能

人工智能是指由机器、机器人、网站、应用程序或其他技术设备模拟人类智能的技术领域。在视频中,人工智能被用来描述一种能够收集和处理数据的技术,类似于人类观察、阅读、计数和听觉的方式。

💡数据收集

数据收集是指获取、记录和存储信息的过程,这些信息可以用于分析和决策。在AI领域,数据收集是基础步骤,它使得AI系统能够通过视觉、听觉和语言处理来理解和响应外部世界。

💡微软认知服务

微软认知服务是一套由微软开发的API工具集,旨在帮助开发者将人工智能功能集成到他们的应用程序中。这些服务分为五个类别:视觉、语音、语言、搜索和决策,每个类别都包含了一系列用于特定任务的API。

💡APIs

API(应用程序编程接口)是一组预定义的函数或协议,它允许不同的软件应用程序之间进行交互。在AI开发中,APIs是构建和集成智能功能的关键工具,它们使得开发者能够利用现成的功能来扩展他们的应用程序。

💡面部识别

面部识别是一种生物识别技术,它通过分析和比较人脸的特征来识别或验证个人身份。在AI系统中,面部识别API可以用于多种应用,如安全验证、情感分析或健康监测。

💡计算机视觉

计算机视觉是AI的一个分支,它使计算机能够从图像或多维数据中解释和理解视觉信息。这项技术可以用于对象识别、场景理解和其他视觉任务。

💡语音转文本

语音转文本是一种技术,它可以将人类的语音转换成书面文字。这种技术在AI中被广泛应用于语音识别、自动字幕生成和语音控制系统。

💡翻译API

翻译API是一种服务,它允许开发者在其应用程序中集成自动语言翻译功能。这种API可以支持多种语言之间的即时翻译,从而提高软件的多语言能力和全球可访问性。

💡健康领域

健康领域是指与维护、恢复和提升人类健康相关的所有活动和服务。在AI应用中,健康领域通常涉及到使用智能技术来改善医疗保健的效率、质量和可访问性。

💡医院入口系统

医院入口系统是指用于管理医院入口处患者流动和登记的系统。这样的系统可以通过自动化流程来提高效率,减少等待时间,并改善患者体验。

💡决策

决策是指在多个选项中选择特定行动方案的过程。在AI中,决策通常涉及到机器学习模型,它们根据已有数据和算法来预测最佳结果或行动。

Highlights

我们的AI三步过程从我们希望收集的数据开始。

人类通过看、读、计数或听来收集数据,AI也尝试以类似的方式接收数据。

微软开发了帮助我们向AI输入数据的工具,称为微软认知服务。

微软认知服务分为五个类别:视觉、语音、语言、搜索和决策。

这些类别中包含的工具称为API(应用程序编程接口)。

构建AI时需要API,就像建房子需要锤子和锯子一样。

第一步是确定我们试图找到和接收的数据,以及我们将使用哪些API来实现这一目标。

通过创造一个AI概念来解释这一点,我们将在AI健康类别中进行创新。

我们要解决的问题是医院候诊室的长时间等待。

如果我们正在构建一个AI医院入口系统,用于检查患者并评估他们的状况,我们将使用面部和计算机视觉API。

我们可能还会使用语音转文本API来接收患者谈论他们状况时说的话。

为了提高包容性,我们可能还会使用翻译API来理解不同语言的患者。

这是一个良好的开端,你可以看到如何轻松地引入不同的API来开始确定我们的AI将如何收集数据。

第一步完成。

Transcripts

00:00

[Music]

00:02

our one two three step ai process begins

00:05

with the data that we're hoping to

00:07

collect with our ai

00:09

as humans we see things or read things

00:13

or count things or hear things and every

00:16

time we are taking these actions we're

00:19

bringing data into our brain

00:21

what we are attempting to do with ai is

00:24

to have a machine

00:25

robot website

00:28

app or other piece of technology

00:31

take in data in a similar way the great

00:34

thing that makes this a lot easier for

00:36

you as up-and-coming ai developers

00:39

is that microsoft has developed tools

00:41

that help us get this data into our ai

00:45

they are called the microsoft cognitive

00:48

services and there are five categories

00:50

of them

00:52

there is vision where technology is

00:54

trying to see things

00:56

speech where technology is trying to

00:58

hear and say things

01:01

language where technology is trying to

01:04

understand and use different languages

01:07

search where technology is scanning data

01:10

sets and decision where technology is

01:14

trying to do something with everything

01:16

it's just learned

01:19

within these categories are the tools

01:21

called apis

01:24

that stands for application programming

01:26

interface but to keep things simple

01:29

we'll just refer to them as apis

01:32

these are tools and just like when you

01:35

build a house you need tools such as a

01:37

hammer and a saw

01:39

when you are building an ai you need

01:41

these apis

01:43

now with step one of our one two three

01:45

step process

01:47

all we're asking is

01:49

what data are we trying to find and

01:52

receive and what apis are we going to

01:55

use to help us achieve that

01:58

let's explain this by inventing an ai

02:00

concept right now

02:03

we will innovate in the ai for health

02:05

category and the problem we want to

02:07

solve

02:08

is long delays in hospital waiting rooms

02:12

so perhaps if we were building an ai

02:15

hospital entry system that was checking

02:18

in patients and assessing their

02:20

conditions

02:21

from the vision cognitive services we

02:24

would definitely want to use the face

02:27

and computer vision apis

02:29

because there may be some things we can

02:31

pick up from the faces of our patients

02:34

we may also want to use the

02:36

speech-to-text api to be able to receive

02:40

what the patients say when they talk

02:42

about their condition

02:44

and maybe to improve inclusion we may

02:47

also use the translator api so we can

02:51

understand patients in a range of

02:53

different languages

02:55

that's a pretty good start and you can

02:57

see how easy it was to bring in

03:00

different apis to begin to determine how

03:03

our ai will collect data

03:06

step 1 done

Rate This

5.0 / 5 (0 votes)

相关标签
人工智能认知服务健康创新医院效率面部识别语音转文本多语言翻译数据收集API工具技术教育