Another glorious battle for AI dominance… GPT-4o vs Google I/O

Fireship
15 May 202404:39

Summary

TLDRGestern fand die Google I/O Entwicklerkonferenz statt, bei der Google beeindruckende Ankündigungen machte, um mit OpenAI Schritt zu halten. OpenAI überraschte jedoch mit der Veröffentlichung von GPT-4 Omni, einem Modell, das Text, Vision und Audio kombiniert und beeindruckende menschliche Konversationsfähigkeiten zeigt. Google präsentierte ebenfalls neue Technologien, darunter das KI-Modell Gemini 1.5 Pro, das einen 2-Millionen-Token-Kontext verarbeiten kann, und Firebase Data Connect, das PostgreSQL in Firebase integriert. Die Konkurrenz zwischen OpenAI und Google intensiviert sich, während beide um die Integration ihrer Modelle in iPhones kämpfen.

Takeaways

  • 😀 Google hielt gestern die jährliche Entwicklerkonferenz Google IO ab.
  • 📊 Google stellte eine SQL-Datenbank für Firebase vor.
  • 🤖 OpenAI veröffentlichte GPT-4 Omni kurz vor Google IO, was als Provokation angesehen wurde.
  • 💬 GPT-4 Omni kombiniert Text, Vision und Audio in einem Modell mit beeindruckenden menschenähnlichen Konversationsfähigkeiten.
  • 📱 OpenAI und Google konkurrieren darum, ihre Modelle auf das iPhone zu bringen.
  • 🌌 Google stellte Gemini 1.5 Pro vor, das ein Kontextfenster von 2 Millionen Tokens handhaben kann.
  • 💡 Google führte 'Kontext-Caching' ein, um Tokens kostengünstiger wiederzuverwenden.
  • 🛠️ Firebase Data Connect bringt endlich Postgres in Firebase.
  • 🎮 Google startete einen Wettbewerb für Entwickler, bei dem der Gewinner einen elektrischen DeLorean erhält.
  • 🔧 Project IDX ist nun für die Öffentlichkeit zugänglich und integriert Browser-basierte VS Code- und mobile Emulatoren.

Q & A

  • Was war das größte Highlight der Google I/O-Konferenz 2024?

    -Das größte Highlight der Google I/O-Konferenz 2024 war die Ankündigung von Gemini 1.5 Pro, das nun ein Kontextfenster von 2 Millionen Tokens verarbeiten kann.

  • Welche neue Datenbankfunktion wurde für Firebase angekündigt?

    -Google hat eine SQL-Datenbank für Firebase angekündigt, die als Firebase Data Connect bekannt ist und Postgres in Firebase integriert.

  • Was ist das Besondere an OpenAI's GPT-4 Omni?

    -GPT-4 Omni kombiniert Text, Vision und Audio in einem einzigen Modell und zeichnet sich durch seine menschenähnlichen Konversationsfähigkeiten aus.

  • Welche neuen Hardwareprodukte wurden von Google angekündigt?

    -Google kündigte neue Hardwareprodukte wie Trillium TPUs und Axion, seine neuen ARM-basierten CPUs für Rechenzentren, an.

  • Was ist das neue Werkzeug namens Firebase Gen Kit?

    -Firebase Gen Kit ist ein neues Werkzeug, das in OAMA integriert ist und es einfach macht, AI-fähige API-Endpunkte zu erstellen.

  • Welche neue Funktion hat Google eingeführt, um die Kosten für Tokens zu senken?

    -Google führte die Funktion 'Kontext-Caching' ein, die Tokens wiederverwenden kann, um die Kosten erheblich zu senken.

  • Was ist das neue Projekt Astro von Google?

    -Projekt Astro ist ein neues AI-Modell von Google, das sich ähnlich wie GPT-4 Omni anfühlt und in der Lage ist, Aufgaben wie das Erinnern an den Ort von Objekten zu erfüllen.

  • Welche Konkurrenz besteht zwischen OpenAI und Google in Bezug auf iPhone-Integration?

    -Sowohl OpenAI als auch Google sind in Gesprächen, um ihre Flaggschiffmodelle auf dem iPhone zu integrieren, um von Apple finanziell zu profitieren.

  • Warum hat OpenAI kürzlich Schlagzeilen gemacht?

    -OpenAI machte Schlagzeilen, weil sie sich von ihrem ehemaligen Chief Scientist und Mitgründer Ilia getrennt haben.

  • Was ist Project IDX und was bietet es?

    -Project IDX ist jetzt öffentlich zugänglich und ist ein browserbasiertes VS Code, das mit mobilen Emulatoren und anderen Tools integriert ist.

Outlines

00:00

📢 Google IO und die künstliche Rivalität

Gestern fand die jährliche Entwicklerkonferenz Google IO statt, bei der Google versuchte, mit seinem künstlichen Rivalen OpenAI mitzuhalten. Google kündigte beeindruckende Neuerungen an, darunter eine SQL-Datenbank für Firebase. Doch das Highlight war die Ankündigung des neuen GPT-4-Modells von OpenAI, das kurz vor der Google IO veröffentlicht wurde, was eine zufällige Provokation zu sein schien.

🚀 Vorstellung von GPT-4 Omni

OpenAI stellte das neue GPT-4 Omni vor, ein Modell, das schneller und günstiger als GPT-4 Turbo ist und Text-, Bild- und Audioverarbeitung in einem einzigen Modell kombiniert. Besonders beeindruckend sind die menschenähnlichen Gesprächsfähigkeiten. Dieses Modell kann in verschiedenen Tonlagen sprechen, von dramatisch bis entspannt, obwohl diese Funktionen noch nicht öffentlich verfügbar sind.

📱 Konkurrenz um das iPhone

Sowohl OpenAI als auch Google versuchen, ihre Flaggschiff-Modelle auf das iPhone zu bringen, um von Apple zu profitieren. Google zeigte bei der IO-Konferenz das Projekt Astro, das ähnlich wie GPT-4 Omni wirkt, aber mit größerer Latenz und weniger natürlicher Stimme.

🔍 Drama bei OpenAI

OpenAI trennte sich kürzlich von Ilia, ihrem ehemaligen Chief Scientist und Mitgründer, der als der Kopf hinter OpenAI galt. Die genauen Gründe für die Trennung bleiben unklar, und die Wahrheit könnte erst in ihren Memoiren in den 2040ern bekannt werden.

💡 Wichtige Ankündigungen von Google IO

Die größte Ankündigung von Google war Gemini 1.5 Pro, das ein 2-Millionen-Token-Kontextfenster verarbeiten kann. Google führte auch das Context Caching ein, um Tokens kostengünstiger wiederzuverwenden. Zudem startete Google einen Wettbewerb für Entwickler, bei dem der Gewinner einen elektrischen DeLorean erhält, und stellte neue Tools wie Firebase Gen Kit und Firebase Data Connect vor, das PostgreSQL in Firebase integriert.

🖥️ Neue Hardware und Tools

Google kündigte neue Hardware wie Trillium TPUs und Axion, neue ARM-basierte CPUs für Rechenzentren, sowie das generative Videomodell VO an, das mit OpenAI's Sora konkurrieren soll. Diese Fortschritte zeigen beeindruckende Entwicklungen im Vergleich zum Vorjahr.

🤔 Fortschritt zur Singularität

Trotz der beeindruckenden Technologie fühlt es sich an, als ob wir an einem Plateau stehen, was den Fortschritt zur Singularität betrifft. Die neuen Modelle wie GPT-4 Omni, Claude und Gemini 1.5 haben ihre Grenzen erreicht und es bedarf eines großen Durchbruchs, um echte Intelligenz und unabhängiges Lernen zu ermöglichen. Bis dahin bleibt der Weg zur Singularität noch weit.

Mindmap

Keywords

💡Google IO

Google IO ist die jährliche Entwicklerkonferenz von Google, auf der das Unternehmen neue Technologien und Produkte vorstellt. In dem Video wird Google IO als Plattform beschrieben, auf der Google versucht, mit OpenAI zu konkurrieren, insbesondere in Bezug auf künstliche Intelligenz.

💡OpenAI

OpenAI ist ein führendes Unternehmen im Bereich der künstlichen Intelligenz, bekannt für die Entwicklung fortschrittlicher KI-Modelle wie GPT-4. Im Video wird betont, wie OpenAI Google durch die überraschende Veröffentlichung neuer Modelle vor deren eigener Konferenz in den Schatten stellt.

💡GPT-4

GPT-4 ist das neueste KI-Modell von OpenAI, das Text, Vision und Audio in einem einzigen Modell kombiniert. Es zeichnet sich durch seine menschenähnlichen Konversationsfähigkeiten aus, die im Video als bedeutender Fortschritt hervorgehoben werden.

💡Gemini 1.5 Pro

Gemini 1.5 Pro ist Googles fortschrittliches KI-Modell, das mit einem großen Kontextfenster von 2 Millionen Tokens arbeitet. Im Video wird dieses Modell als bedeutender Fortschritt von Google beschrieben, obwohl es immer noch hinter OpenAI zurückzubleiben scheint.

💡Firebase

Firebase ist eine Plattform von Google für die Entwicklung mobiler und Web-Anwendungen. Im Video wird die Einführung einer SQL-Datenbank für Firebase als bahnbrechend beschrieben, da dies eine lang erwartete Funktion ist, die Firebase zu einem noch stärkeren Tool macht.

💡Project Astro

Project Astro ist ein neues Projekt von Google, das ähnlich wie GPT-4 Omni funktioniert und bei Google IO vorgestellt wurde. Es zeigt die Fähigkeit, auf Sprachbefehle zu reagieren und Objekte zu erkennen, wobei jedoch noch Latenzprobleme bestehen.

💡Context Caching

Context Caching ist eine neue Funktion von Google, die das Wiederverwenden von Tokens kostengünstiger macht. Im Video wird es als Antwort auf die hohen Kosten für die Verarbeitung großer Datenmengen durch KI-Modelle beschrieben.

💡Trillium TPUs

Trillium TPUs sind neue Hardwarekomponenten von Google, die speziell für den Einsatz in Rechenzentren entwickelt wurden. Sie werden im Video als Teil von Googles Bemühungen erwähnt, ihre KI- und Datenverarbeitungsfähigkeiten zu verbessern.

💡VOA

VOA ist ein generatives Videomodell von Google, das in Konkurrenz zu OpenAIs Modellen entwickelt wurde. Im Video wird betont, wie beeindruckend diese Technologie ist, obwohl sie weiterhin hinter OpenAIs Entwicklungen zurückzubleiben scheint.

💡Singularität

Die Singularität ist ein hypothetischer Punkt in der Zukunft, an dem technologische Fortschritte so weit fortgeschritten sind, dass künstliche Intelligenz menschliche Intelligenz übertrifft. Im Video wird eine gewisse Enttäuschung darüber ausgedrückt, dass trotz der Fortschritte in der KI-Entwicklung dieser Punkt noch nicht erreicht ist.

Highlights

Google announced a SQL database for Firebase at their annual developer conference.

OpenAI released their new flagship model, GPT-4 Omni, just before Google IO.

GPT-4 Omni combines text, vision, and audio into a single model and has impressive human-like conversational abilities.

OpenAI's new model can vary its tone from dramatic to sarcastic to super chill for bedtime stories.

OpenAI is in talks to integrate their technology on the iPhone, competing with Google's Gemini model.

Google demoed Project Astro, similar to GPT-4 Omni, but with more latency and a more robotic voice.

OpenAI's former Chief Scientist and co-founder Ilia has parted ways with the company.

Google announced Gemini 1.5 Pro, which can handle a 2 million token context window.

Gemini 1.5 Pro's context window can process 2 hours of video content or 60,000 lines of code.

Google introduced context caching to reuse tokens at a fraction of the cost.

Google launched a competition for developers to build the best Gemini-powered app, with the winner receiving an electric DeLorean.

Google released Firebase Gen Kit, integrated with AI and mobile emulators, and opened Project IDX to the public.

Firebase Data Connect now officially brings PostgreSQL into Firebase.

Google announced new hardware, including Trillium TPUs and Axion, its new ARM-based CPUs for data centers.

Google introduced Voila, a generative video model to compete with OpenAI's technology.

Transcripts

00:00

yesterday was Google IO the annual

00:02

developer conference where Google

00:03

desperately tries to catch up to its

00:05

artificial rival open AI

00:08

Google Google announced some crazy stuff

00:10

I never thought I would see in my

00:11

lifetime like a SQL database for

00:13

Firebase more on that later because

00:15

first we need to talk about the biggest

00:16

announcement at iio open ai's new GPT 4

00:19

oh oh oh you see open AI hype Lord Sam

00:22

Alman yet again wrapped up Sundar in a

00:25

wet blanket by releasing GPT 40 just

00:27

hours before Google IO which is a total

00:30

coincidence and definitely not designed

00:31

to troll Google in today's video we'll

00:33

break down this artificial beef but more

00:35

importantly look at all kinds of crazy

00:36

new technology released in just the last

00:38

48 hours it is May 15th 2024 and you

00:42

watching the code report on Monday open

00:43

aai had a surprise spring update where

00:46

they unveiled their new flagship model

00:47

gp4 Omni you've got me on the edge of my

00:51

well I don't really have a seat but you

00:53

get the idea what's the big news yeah

00:56

we've got a new model which is faster

00:58

and cheaper than gp4 turbo and combines

01:00

text vision and audio into a single

01:02

model what was most impressive though

01:04

was its humanlike conversational

01:06

abilities well well well just when I

01:09

thought things couldn't get any more

01:11

interesting talking to another AI that

01:14

can see the World by default it uses a

01:17

California Valley Girl accent set to

01:19

maximum cringe but the tone of the voice

01:21

can vary from dramatic to sarcastic to

01:23

Super chill for bedtime stories a

01:25

bedtime story about robots and love I

01:28

got you covered this technology will be

01:30

a huge leap forward for your AI

01:32

girlfriend and you can use the GPT 40

01:34

model today but the conversational part

01:36

of it is still not available to the

01:37

public that's disappointing but what you

01:39

also need to know is that open AI is in

01:41

talks to put their technology on the

01:43

iPhone but Google also wants to get its

01:45

Flagship model on the iPhone as well it

01:47

talks are on going to also get Gemini on

01:48

the iPhone so these companies are

01:50

competing to create a model that's smart

01:52

but also fast and cheap enough to run on

01:54

mobile in order to get that massive bag

01:56

from Apple yesterday at IO Google demoed

01:58

something called project Astro which

02:00

feels similar to for Omni do you

02:01

remember where you saw my

02:05

glasses yes I do your glasses were on

02:08

the desk near a red apple it's cool but

02:10

there's more latency and the voice is

02:11

more robotic compared to open AI now

02:13

what's also very interesting is that

02:15

open AI just parted ways with Ilia their

02:17

former Chief scientist and co-founder

02:19

who many people used to worship as the

02:21

brains behind open AI there's definitely

02:23

some underline drama here but we likely

02:25

won't know the truth until they release

02:26

their Memoirs in the 2040s but now let's

02:29

finally talk about Google IO the biggest

02:31

AI announcement from Google was Gemini

02:33

1.5 Pro which can now handle a 2 million

02:35

token context window that could be 2

02:37

hours of video content or 60,000 lines

02:40

of code that's a lot of context but

02:41

tokens can be expensive and to address

02:43

that they released a new feature called

02:45

context caching that can reuse tokens

02:47

for a fraction of the cost in addition

02:49

Google launched a competition for

02:51

developers and whoever builds the best

02:52

Gemini powered app wins an electric

02:54

DeLorean to make building this app

02:56

easier they also released a new tool

02:58

called Firebase gen kit which which is

03:00

integrated with oama and makes it easy

03:02

to build AI enabled API endpoints in

03:04

addition project idx is now open to the

03:06

public which is a browser-based vs code

03:09

that's also integrated with things like

03:10

mobile emulators by far the most

03:12

exciting thing for me though is a new

03:14

tool called Firebase data connect which

03:16

officially brings postgress into

03:18

Firebase this has been the number one

03:19

most requested feature for years how do

03:21

I use Firebase with SQL and its absence

03:24

is led to startups like superbase which

03:26

is branded as a Firebase alternative but

03:28

now in 2024 the turns of table Firebase

03:31

is now the superbase alternative I'm a

03:33

big fan of both super base and Firebase

03:35

and if you want to learn these

03:35

Technologies check out my full courses

03:37

on fireship iio and stay tuned for a

03:39

full tutorial on data connect on my

03:41

second Channel Beyond fireship soon

03:43

Google also announced some new hardware

03:44

like Trillium tpus and Axion its new

03:47

arm-based CPUs for data centers and

03:49

finally Google also announced vo a

03:51

generative video model to compete with

03:53

open AI Sora it's extremely impressive

03:56

compared to where we were just a year

03:57

ago but yet again it just feels one step

03:59

on behind open AI we just looked at all

04:01

kinds of crazy new gamechanging

04:02

technology but at this point I'm feeling

04:04

a little disappointed with our progress

04:06

towards the singularity it's been over a

04:08

year since GPT 4 and unfortunately I

04:10

still have a job four Omni Claude and

04:12

Gemini 1.5 all seem to be pretty maxed

04:14

out on how far they can get with these

04:16

benchmarks making models faster and

04:17

cheaper is great but if they're not

04:19

becoming more intelligent then the

04:20

singularity is nowhere in sight they've

04:22

already absorbed almost all the

04:23

information humans have created is so

04:25

unless there's a major breakthrough that

04:26

makes AI actually intelligent and able

04:28

to learn independently it sure looks

04:30

like we're standing on the edge of a

04:31

plateau and the only place to go is the

04:33

trough of disillusionment this has been

04:35

the code report thanks for watching and

04:37

I will see you in the next one