Ze světa IT

OpenAI přepsala více než milion hodin videí na YouTube

ChatGPT
Foto: pixabay.com, Tag: ChatGPT

Deník The Wall Street Journal začátkem tohoto týdne informoval, že společnosti zabývající se umělou inteligencí narážejí na problém, pokud jde o shromažďování kvalitních tréninkových dat. Dnes deník The New York Times podrobně popsal některé způsoby, jak se s tím společnosti vypořádaly. Nepřekvapivě se jedná o činnosti, které spadají do mlhavé šedé zóny autorského práva v oblasti umělé inteligence.

Model přepisu zvuku Whisper

Příběh začíná u společnosti OpenAI, která v zoufalství z nedostatku tréninkových dat údajně vyvinula svůj model přepisu zvuku Whisper, aby se dostala přes tuto překážku, a přepsala více než milion hodin videí z YouTube, aby mohla trénovat svůj nejpokročilejší velký jazykový model GPT-4. Tvrdí to deník The New York Times, který uvádí, že společnost věděla, že je to právně sporné, ale považovala to za spravedlivé použití. Prezident OpenAI Greg Brockman se osobně podílel na shromažďování videí, která byla použita, píše Times.

Mluvčí OpenAI Lindsay Heldová sdělila v e-mailu serveru The Verge, že společnost pro každý ze svých modelů opatřuje „jedinečné“ soubory dat, aby „pomohla jejich pochopení světa“ a udržela si konkurenceschopnost v celosvětovém výzkumu. Heldová dodala, že společnost využívá „řadu zdrojů včetně veřejně dostupných dat a partnerství pro neveřejná data“ a že se zabývá vytvářením vlastních syntetických dat.

Co je OpenAI?

OpenAI je umělá inteligence (UI) výzkumná laboratoř a společnost zabývající se vývojem pokročilých umělých inteligencí. Byla založena v roce 2015 s cílem podporovat a rozvíjet technologie umělé inteligence a jejich použití pro dobro lidstva. Společnost se zaměřuje na výzkum a vývoj v oblastech jako jsou strojové učení, přírodní jazyk zpracování, robotika a dalších oblastech umělé inteligence.

OpenAI je známá svými významnými projekty a publikacemi, včetně vytvoření jazykového modelu GPT (Generative Pre-trained Transformer) a různých aplikacích umělé inteligence, které využívají tento model. Společnost také publikuje vědecké práce a poskytuje platformy a nástroje pro vývojáře, aby mohli pracovat s pokročilými umělými inteligencemi.

Jedním z cílů OpenAI je také prosazovat transparentnost a etické použití umělé inteligence, aby se minimalizovaly rizika spojená s jejím rozvojem a nasazením.

MŮŽE SE VÁM TAKÉ LÍBIT ▼

Komentuj ▼

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *

Více článků ► Ze světa IT