AI神助攻，轻松驾驭ChatGPT的五大神器，，一跃成为GPT达人 | 回到Axton

人工智能 | ChatGPT & AIGC

16 Apr 202316:31

Summary

TLDR本期视频Axton分享了几个实用的AI工具和技巧。首先介绍了如何从OpenAI官网导出ChatGPT对话记录的方法。接着，推荐了一个Mac平台下方便使用ChatGPT的小工具，以及如何通过API key使用。此外，还介绍了Mac Whisper，一个高效的语音转文字工具，包括其不同版本的特点和使用方法。最后，提到了开源项目Buzz，一个跨平台的语音识别软件，以及使用OpenAI的Whisper API进行识别的体验。

Takeaways

📤 OpenAI提供了导出ChatGPT对话记录的功能，用户可以在Settings中找到导出数据的链接。
📧 导出的数据会发送到用户的注册邮箱，并包含一个下载文件的链接。
📂 下载的文件包括chat.html和conversation.json等格式，方便用户查看和处理对话记录。
🔗 Mac用户可以使用一个名为MacGPT的小工具，通过快捷键快速访问ChatGPT对话栏。
💻 MacGPT支持语音输入和输出，允许用户在写作过程中直接与ChatGPT交互。
🔑 使用MacGPT前需要输入API key，用户可以在OpenAI官网创建新的API key并配置。
💬 MacGPT的Inline功能允许用户在输入文字时直接提问并获取答案，但需要Accessibility权限。
🎤 开发者还提供了另一款名为Mac Whisper的工具，用于语音到文字的转换。
🗣️ Whisper的Small模型适合一般语音识别需求，而Large模型提供更高的识别精准度。
📊 对比开源项目Buzz和Mac Whisper，Buzz免费但依赖本地计算资源，而Whisper Pro版提供更多功能和模型。
🌐 根据用户需求和资源情况，可以选择使用本地模型或OpenAI的API服务，后者虽然快速但需要付费。

Q & A

如何导出ChatGPT的对话记录？
-首先登录ChatGPT网站，进入Settings设置页面，找到导出数据的链接点击后，会有三个提示，确认后数据将发送到注册邮箱，包含下载链接。
导出的ChatGPT对话记录包含哪些文件格式？
-导出的文件包括chat.html（可读的HTML格式对话记录文档），conversation.json（对话记录的JSON格式文件），feedback文件（可能包含Playground信息）以及用户信息文件。
Mac下使用ChatGPT的快捷键工具有哪些功能？
-该工具可以通过快捷键一键呼出对话栏，通过菜单栏打开ChatGPT对话窗口，拷贝对话记录，以及在书写过程中直接输入指令让ChatGPT返回结果写在光标所在位置，还支持语音对话。
MacGPT工具的下载链接在哪里？
-下载链接在Gumroad上，可以在视频描述栏中找到。
如何设置MacGPT工具的API key？
-进入OpenAI网站，创建新的API key，然后在MacGPT工具的设置界面输入API key，选择API模型（如3.5或4），并根据需要设置快捷键和Inline功能。
Mac Whisper是做什么的？
-Mac Whisper是一个语音到文字的转换工具，可以用来识别视频字幕，提高字幕制作效率。
Mac Whisper有哪些版本？
-Mac Whisper有免费版和Pro版，免费版提供基础功能，Pro版提供更多导出格式和更高级的语言模型。
如何获取并使用Mac Whisper的Pro版模型？
-在Mac Whisper的Manager Models中下载Pro版模型，或者购买使用。
Github上的Buzz项目与Mac Whisper有何不同？
-Buzz是开源项目，可在多平台（Mac, Windows, Linux）上使用，而Mac Whisper是商业软件，提供更多专业功能。
使用OpenAI的Whisper API进行语音识别的收费情况如何？
-Whisper API按分钟收费，一分钟大约0.006美元。
在决定使用哪种语音识别模型时，应该考虑哪些因素？
-应根据实际需求和预算考虑，包括识别速度、准确率、是否需要下载模型到本地以及是否愿意支付API使用费用。
Buzz项目支持哪些格式的导出？
-Buzz支持导出为TXT, SRT或者VTT格式的字幕。

Outlines

00:00

📂 ChatGPT对话记录导出功能介绍

本段介绍了如何使用OpenAI官方推出的功能来导出ChatGPT的对话记录。首先，用户需要登录ChatGPT网站并进入设置，找到导出数据的链接。导出过程会提示用户关于账号信息和对话记录的包含情况，并说明数据将通过注册邮箱发送。用户需要等待一段时间以便数据准备完成，之后会收到带有下载链接的邮件。下载的文件包括一个可读的HTML格式的对话记录文档和一个JSON格式的对话记录文件，以及用户反馈信息和其他相关文件。此外，还介绍了一个Mac下方便使用ChatGPT的小工具，它允许用户通过快捷键快速呼出对话栏，直接输入指令，并支持语音对话。该工具的下载链接位于描述栏中，用户可以免费下载。

05:02

💬 MacGPT的Inline功能与Mac Whisper语音识别工具

这一部分详细介绍了MacGPT的Inline功能，允许用户在输入文字过程中直接提问GPT并获取答案，同时介绍了如何设置快捷键和API模型。接着，介绍了另一款由MacGPT开发者开发的语音识别工具Mac Whisper，它基于OpenAI的Whisper API，可以将语音转换为文字。讨论了不同版本的Mac Whisper，包括免费版和Pro版，以及它们的功能和价格。此外，还提到了使用Whisper进行视频字幕制作的效率提升，并通过实际测试比较了不同模型的效果。最后，介绍了一个名为Buzz的开源项目，它提供了跨平台的语音识别功能。

10:03

🔊 语音识别模型的选择与性能对比

本段内容主要讨论了不同语音识别模型的选择和性能对比。首先，介绍了Mac Whisper中不同大小的模型，包括Small、Medium和Large，以及它们的识别速度和精确度。然后，比较了免费版和Pro版的主要区别，特别是在模型选择和导出格式方面。接着，探讨了在Github上找到的开源项目Buzz，它提供了类似的功能，并且可以免费使用。最后，通过实际测试比较了不同模型在识别英文时的效果，并讨论了使用本地模型与使用OpenAI API的区别，包括速度和成本。

15:04

🎤 语音识别工具的使用场景与总结

这部分总结了语音识别工具的使用场景和效果。讨论了Mac Whisper和Buzz等工具在不同情况下的表现，包括在字幕制作中的应用。强调了Large模型在处理较长音频时的高识别准确率，即使在发音不准确的情况下。同时，比较了使用本地模型和OpenAI API的成本效益，指出API的使用虽然快速但需要付费。最后，介绍了识别结果的导出格式，以及开源软件Buzz的功能和适用性。视频以Axton的结束语和对观众的感谢结束。

Mindmap

Keywords

💡OpenAI

OpenAI是一个人工智能研究实验室，致力于确保人工智能（AI）的发展能够以对人类有益的方式进行。在视频中，OpenAI是导出ChatGPT对话记录功能和Whisper语音识别API的提供者，这体现了其在AI领域的领导地位和技术实力。

💡ChatGPT

ChatGPT是OpenAI开发的一种基于GPT（生成预训练变换器）架构的聊天机器人。它能够理解和生成自然语言文本，与用户进行互动式对话。在视频中，ChatGPT的对话记录导出功能被详细介绍，展示了用户如何管理和保存与ChatGPT的交流内容。

💡导出数据

导出数据是指将存储在某个系统或平台中的信息复制并转移到另一个系统或介质上的过程。在视频中，用户可以通过OpenAI提供的链接导出其ChatGPT的对话记录，包括文本和用户信息，以便在本地进行保存和管理。

💡MacGPT

MacGPT是一款为Mac操作系统设计的辅助工具，它允许用户通过快捷键快速访问ChatGPT，实现在任何应用程序中直接输入问题并获取答案的功能。这个工具提高了与ChatGPT交互的便捷性，特别适合需要快速获取信息或灵感的用户。

💡API key

API key（应用程序编程接口密钥）是一种用于身份验证的代码，它允许开发者在开发应用程序时与特定服务进行安全通信。在视频中，API key用于激活和配置MacGPT工具，以便用户可以通过该工具与OpenAI的ChatGPT和Whisper服务进行交互。

💡Whisper

Whisper是OpenAI开发的一种语音识别技术，能够将语音转换成文字。它在视频中被提及，作为一个高效的工具，尤其适用于视频字幕制作和其他需要将语音资料转换为文本的场景。

💡语音识别

语音识别是指通过计算机程序将人类的语音转换成可读的文本数据的过程。视频中讨论了OpenAI的Whisper API和其他相关工具，展示了它们在语音识别方面的应用和效果。

💡字幕

字幕是指在视频或电影播放时，显示在屏幕上的书面文字，通常用于提供翻译或解释对话内容。在视频中，字幕制作是Whisper和相关工具的一个重要应用场景，说明了AI技术在媒体制作领域的实用性。

💡模型

在人工智能领域，模型通常指的是用于处理特定任务的算法结构，它可以基于输入数据进行学习和预测。视频中提到的Whisper的Small、Medium、Large模型，代表了不同大小和性能的语音识别算法，用户可以根据需要选择合适的模型。

💡开源项目

开源项目指的是其源代码公开可用，允许任何人查看、使用和修改的软件项目。在视频中，提到了名为Buzz的开源项目，它提供了一个免费的语音识别工具，用户可以在不同的操作系统上使用它，而不受限于商业软件的许可和费用。

Highlights

OpenAI推出了导出ChatGPT对话记录的功能

导出数据的链接位于ChatGPT网站的Settings中

导出的数据会发送到注册邮箱，并附带下载链接

导出的文件包括账号信息和对话记录

导出文件中有chat.html和conversation.json等格式

Mac下方便使用ChatGPT的小工具可以通过快捷键呼出对话栏

小工具支持菜单栏直接打开对话窗口和拷贝对话记录

小工具还支持语音与ChatGPT对话

MacGPT小工具的下载链接位于Gumroad上

使用MacGPT需要输入API key并选择API模型

Mac Whisper是MacGPT开发者开发的语音到文字转换工具

Whisper的API和ChatGPT的API同时发布，但后者更受关注

Whisper识别效率提高至少三倍

Whisper有免费版和Pro版，Pro版提供更多功能和模型

Github上的Buzz项目是开源的语音识别软件

Buzz支持Mac、Windows和Linux平台

Buzz的Large模型识别准确率高，但需要下载到本地

OpenAI的Whisper API识别速度快，但需要付费

识别结果可以导出为TXT、SRT或VTT格式

Buzzle作为开源软件，功能虽少但足以满足大部分字幕需求