AI for Cultural Heritage: the Māori language included in Microsoft Translator app

Microsoft
21 Nov 201902:32

Summary

TLDR该视频脚本强调了毛利语对于毛利人身份的重要性,并讲述了毛利语在二战后随着人口迁移至城市而逐渐减少的情况。为了振兴毛利语,提出了利用人工智能和神经机器学习的必要性。通过与奥克兰理工大学的团队合作,使用仅含毛利语的数据来训练AI,微软提供平台支持,使AI随着使用而不断学习。强调了语言要在日常情境中被常态化,以便人们更愿意使用。微软翻译器的应用将增加翻译机会,促进语言的传播。通过不断创新,为语言创造更多接触机会,人们将继续参与并使用毛利语,使其不仅得以生存,还能繁荣发展。

Takeaways

  • 🌐 个人身份与语言紧密相连,语言是连接过去和未来的钥匙。
  • 📚 毛利语是毛利社区的主导语言,但二战后人们大量迁移到城市,影响了语言的传承。
  • 🗣️ 毛利语是一种口头语言,书面形式仅有200年历史,翻译文本的语料库相对较小。
  • 📉 由于上述原因,毛利语的使用开始减少,面临灭绝的风险。
  • 🌟 为了振兴毛利语,需要日常不断地使用和推广。
  • 🤖 利用人工智能和神经机器学习技术来复兴毛利语。
  • 🏫 与AUT团队合作,使用仅包含毛利语的数据来训练AI。
  • 📈 收集更多特定于毛利语的数据,能够创建更好的AI模型。
  • 💡 微软提供平台支持,随着人们的使用,AI将不断学习和进步。
  • 🔄 语言的存活需要标准化,使其在各种情境中都易于使用。
  • 🔄 微软翻译器将提供更多翻译机会,增加翻译的普及率。
  • 🌟 持续寻找新方法让人们接触和使用毛利语,将有助于语言的持续发展。
  • 🚀 我们已达到一个转折点,这为毛利语的未来存活和繁荣带来了希望。

Q & A

  • 个人身份如何与语言和社区联系在一起?

    -个人身份不仅仅是指个人本身,而是通过语言与过去的先辈和未来的后代相联系。在毛利社区中,语言是连接他们与世界的关键,没有语言,他们将失去对自己身份的理解。

  • 毛利语在毛利社区中的地位如何?

    -毛利语曾是毛利社区中的主导语言,但在二战后,随着人口大量迁移到城市,这种语言开始减少。

  • 毛利语作为书面语言存在多久了?

    -毛利语作为书面语言只存在了200年,相对于其他大语种来说,它的书面文本语料库非常小。

  • 如果不采取行动,毛利语会怎样?

    -如果不采取行动,毛利语可能会灭绝。

  • 如何振兴毛利语?

    -为了振兴毛利语,需要人们全天候使用毛利语,并且需要利用人工智能和神经机器学习技术。

  • AUT团队在毛利语振兴中扮演什么角色?

    -AUT团队正在使用仅包含毛利语的数据进行研究,以创建更好的人工智能模型。

  • 微软在毛利语振兴中提供了什么支持?

    -微软提供了平台支持,随着人们的使用,这个平台将继续学习和进步。

  • 语言要生存下来需要什么条件?

    -为了生存,语言必须被规范化,必须在每种情况下都被认为是正常的,且使用起来必须简单方便。

  • 微软翻译器将如何帮助毛利语?

    -微软翻译器将提供更多的翻译机会,增加翻译的普及率。

  • 如何让人们继续使用毛利语?

    -只要我们继续寻找新的方法来提供对语言的访问,人们就会继续参与使用毛利语。

  • 毛利语的未来前景如何?

    -毛利语已经达到了一个转折点,这给人们带来了对未来的希望,相信毛利语不仅能够生存,还能繁荣发展。

Outlines

00:00

🗣️ 毛利语的传承与挑战

该段落讲述了毛利人的身份认同与他们的语言紧密相连,毛利语是他们世界的钥匙。二战后,毛利人大量迁移到城市地区,而毛利语作为一种口头语言,书面形式仅有200年历史,翻译文本的语料库相对较小。这导致毛利语开始衰退,面临灭绝的风险。为了振兴毛利语,需要利用人工智能和神经机器学习技术,通过AUT团队的合作,使用纯毛利语数据来训练AI。微软提供平台支持,随着人们的使用,AI将不断学习和进步。为了语言的存续,必须使其在各种情境中变得正常和便捷。微软翻译器的引入将增加翻译机会,促进翻译的普及。只要持续寻找新方法来接触和使用语言,人们就会继续参与其中,这为毛利语的存续带来了希望,不仅能够生存,还能繁荣发展。

Mindmap

Keywords

💡身份认同

身份认同是指个人与周围社群的联系和归属感。在视频中,说话者通过语言与祖先和后代建立联系,强调语言是连接他们身份的关键。这体现了身份认同不仅仅是个人的存在,还包括了文化和历史的连续性。

💡毛利语

毛利语是新西兰土著毛利人的传统语言,曾是毛利社群中的主导语言。视频提到毛利语的重要性以及如何通过现代技术手段来振兴这一语言。

💡城市化

城市化是指人口从农村地区迁移到城市地区的过程。在视频中,二战后毛利人的大规模城市化导致了毛利语使用的减少,因为语言的传承在很大程度上依赖于社区和口头传播。

💡口头语言

口头语言是指通过说话来传递信息的语言形式。毛利语作为一种口头语言,其书面形式仅有200年历史,这导致了翻译文本的匮乏,进而影响了语言的保存和传播。

💡人工智能

人工智能是指由机器展示的智能行为,能够模拟人类的认知功能。视频中提到使用人工智能和神经机器学习技术来振兴毛利语,通过创建特定于毛利语的数据和平台,使语言得以保存和发展。

💡数据集

数据集是指收集在一起用于分析或机器学习的数据的集合。在视频中,提到了创建只包含毛利语的数据集,这对于训练和改进人工智能模型至关重要。

💡微软翻译

微软翻译是微软公司提供的一项在线翻译服务,支持多种语言之间的翻译。视频中提到微软翻译将有助于提供更多的翻译机会,从而增加毛利语的普及和使用。

💡语言规范化

语言规范化是指使语言在各种情境中保持一致性和标准化的过程。视频中强调,为了使语言生存下来,它必须在所有情况下都被视为正常,这样才能被广泛使用。

💡语言接触

语言接触是指人们通过使用和学习语言来维持和发展语言的实践。视频中提到,只要我们继续寻找新的方法来提供语言的接触机会,人们就会继续参与使用毛利语。

💡语言消亡

语言消亡是指一种语言不再被其社群使用,最终消失的现象。视频中提到,如果不采取措施,毛利语可能会面临灭绝的风险。

💡语言振兴

语言振兴是指采取措施来保存和促进一种语言的使用和发展。视频强调了通过人工智能和社区参与来振兴毛利语的重要性,以及这种努力带来的希望,使语言不仅能够生存,还能繁荣发展。

Highlights

个人身份不仅仅是我坐在这里,而是与上下文的连接。

通过语言与他们建立联系,我们的语言是我们世界的关键。

如果没有语言,我们将失去对自我认知的理解。

毛利语是毛利社区中的主要语言。

二战后,人们大量迁移到城市地区。

毛利语是一种口头语言,书面形式仅有200年历史。

与其他大语种相比,翻译文本的语料库非常小。

我们看到了语言开始减少。

如果不采取措施,我们的语言表达将面临灭绝。

全天候讲毛利语,无论是白天还是夜晚。

我们需要AI和神经机器学习来振兴毛利语。

我们开始与AUT的团队合作。

我们使用的是仅包含毛利语的数据。

我们获得的特定于毛利语的数据越多,我们能够创造的AI就越强大。

微软提供平台,随着人们的使用,它将继续学习。

为了语言的生存,它必须被规范化,它必须在每种情况下都很正常。

除非它很容易使用,否则人们不会使用它。

微软翻译将意味着将有更多的翻译机会,翻译的普及将增加。

只要我们继续寻找新的方法来获取语言的途径,人们就会继续参与。

我们已经达到了这个转折点,这给了我们对未来的希望,我们的语言将继续生存。

不仅生存,还要繁荣。

Transcripts

00:09

My identity isn't just me sitting here.

00:13

It's all of those above and all of those below.

00:18

I connect to them through my language.

00:23

Our language is the key to our world.

00:28

Without it, we lose the understanding of who we are.

00:38

Māori was the predominant language in Māori communities,

00:41

and after World War II there was

00:42

a huge migration of people into urban areas.

00:45

It was an oral language,

00:46

and it's only been a written language for 200 years.

00:50

The corpus of translated texts is really small

00:53

when you compare it to other big languages.

00:55

And so we saw the language start to dwindle.

00:57

If something wasn't done, then our language would become extinct.

01:06

Speak Māori all the time...

01:10

Speak Māori day and night.

01:19

We need AI and Neural Machine Learning to

01:23

revitalize the Māori language.

01:25

So we started working with the team here at AUT.

01:30

We're using data that's only in Māori language.

01:34

The more data we get that's specific to Māori

01:37

the better the AI we're able to create.

01:40

Microsoft are providing the platform, and then

01:43

as people use it, it will continue to learn.

01:52

For language to survive it must be normalized,

01:55

it must be normal in every situation.

01:57

It has to be easy, otherwise it won't be used.

02:02

What Microsoft Translator will do, will mean that

02:05

there will be more opportunities to translate,

02:07

and that the proliferation of translation will increase.

02:14

As long as we continue to find new ways to create access to the language,

02:18

then people are going to continue to engage.

02:21

We've reached this tipping point, that gives you hope for the future

02:24

that our language will continue to survive.

02:28

And not only survive, but thrive.