Blog
Im Mai 2024 stellte Google eine beeindruckende Reihe von KI-Initiativen vor, die auf die Verbesserung von Foto- und Videoanwendungen abzielen. Hans Hartman, Autor bei Visual 1st, teilte kürzlich in einem Newsletter seine 7 wichtigsten Ankündigungen für die Branche der personalisierten Produkte. Darüber hinaus teilt er einige sehr interessante Neuigkeiten, die Sie in der Branche nicht verpassen sollten. Hier ist eine Zusammenfassung von allem, was er erwähnt hat!
Google I/O
SynthID: Googles unsichtbares KI-Wasserzeichen funktioniert jetzt auch mit Fotos, Videos und Musik.
Projekt Astra: Eine neue App, die mithilfe von künstlicher Intelligenz Informationen über Objekte, auf die Sie zeigen oder denen Sie zuhören, erkennt und bereitstellt.
Veo: Ein neues Tool, das Videos aus Eingabeaufforderungen erstellt, ähnlich wie Sora von OpenAI.
Imagen 3: Die neueste und hochwertigste Version von Googles Tool zur Erstellung von Text in Bilder.
Fotos fragen: Eine neue Funktion von Google Fotos, mit der Sie nach Fotos suchen und Einblicke in Ihre Fotos erhalten können, indem Sie Fragen stellen.
Google Lens: Jetzt können Sie Fragen mit Videos stellen, nicht nur mit Bildern.
Gemini auf Android: Bald können Android-Nutzer KI-generierte Bilder per Drag & Drop in Gmail und andere Apps ziehen. Auf YouTube können Nutzer künftig auch auf „Dieses Video fragen“ tippen, um Informationen in Videos zu finden.
OpenAI
Siri, Google Assistant und Alexa: Aufgepasst! OpenAI hat einen echten multimodalen Chatbot vorgestellt, der auf seinem neuen GPT-4o-KI-Modell basiert („o“ steht für „omni“). Sie können mit dem Bot sprechen, ihm Bilder oder Videos zeigen und Sprachantworten in Echtzeit erhalten.
Mit anderen Worten: Es handelt sich um einen echten multimodalen KI-Chatbot, nicht nur um einen, der Sprache und Bilder in Text und zurück umwandelt. Sie können ihm Fragen stellen wie „Welche Marke trägt diese Person?“ und erhalten eine gesprochene Antwort.
Es wird sich zeigen, ob sich diese sprachgesteuerte Schnittstelle durchsetzen wird. Im Moment sind Textaufforderungen für die Erstellung von KI-Bildern im Vergleich zu traditionellen Schnittstellen wie Schiebereglern und Menüs weniger beliebt.
Sensaria
Einführung von OnePoint, einer neuen API, die die Verwaltung von Print-on-Demand-Aufträgen rationalisiert und verschiedene Sensaria-, Bay Photo- und JONDO-Druckereien weltweit miteinander verbindet.
(Anya Thrash, Executive VP of Marketing bei Bay Photo/Sensaria, wird ihre Erkenntnisse auf der Visual 1st im Rahmen unserer Diskussionsrunde über Innovationen bei Fotodruckprodukten, Technologie und Herstellung mitteilen).
Freepik & Magnific
Freepik hat Magnific übernommen, ein spanisches Unternehmen, das erst vor fünf Monaten eine KI-gestützte Lösung zur Hochskalierung, Verbesserung und Umwandlung von Bildern entwickelt hat. Dies ist die bisher größte Akquisition von Freepik, die zu den Übernahmen von EyeEm, Videvo, Original Mockups und Iconfinder hinzukommt.
Claid
Der visuelle E-Commerce-API-Anbieter Claid hat ein großes Upgrade angekündigt. Es umfasst eine neue Benutzeroberfläche, eine höhere Auflösung, fortschrittliche KI-Tools für die Erstellung hochwertiger Produktfotos und die Integration von 15 KI-Bildtools in einer einzigen API, die es E-Commerce-Kunden ermöglicht, ihre gesamten Arbeitsabläufe zu automatisieren.
Apfel
Auf der jüngsten „Let Loose“-Veranstaltung von Apple wurde die Final Cut Camera App vorgestellt, eine leistungsstarke Videokamera-App, die mehr Kontrolle als die integrierte App bietet. Diese App könnte mit fortschrittlichen Drittanbieter-Apps wie Blackmagic Camera oder Filmic Pro konkurrieren.
Eine herausragende Funktion ist Live Multicam, mit der mehrere iPhones oder iPads angeschlossen werden können, um gleichzeitig Videos aufzunehmen. Diese Aufnahmen werden automatisch an Final Cut Pro übertragen und synchronisiert, sodass eine nahtlose Bearbeitung aus mehreren Blickwinkeln möglich ist. Kurz gesagt: Ihr iPad wird damit zum Multicam-Produktionsstudio.
Profoto
Profoto, ein früherer Gewinner des Visual 1st Best of Show Awards, kündigte Eclipse II an, die zweite Generation seiner Produktfotostation. Sie umfasst eine High-End-Beleuchtungsausrüstung, eine eingebaute Canon EOS R8-Kamera, Workflow-Management-Software und eine iPad-gesteuerte Schnittstelle. Das System ist für die Aufnahme von Fotos und Videos in Profiqualität von Gegenständen wie Schuhen oder Accessoires konzipiert, wobei nur minimale fotografische Kenntnisse erforderlich sind. Das neue System ist heller, schneller und intelligenter als das Original, das von StyleShoots entwickelt wurde, einem Unternehmen, das Profoto im Jahr 2022 übernahm.
Meta
Die KI-Tools von Meta für Werbetreibende können jetzt neue Bilder erstellen, nicht nur Hintergründe. Wenn Sie z. B. ein Produktbild haben, wie eine Tasse Kaffee, können Sie den Hintergrund ersetzen und Variationen des Produkts selbst erstellen, z. B. aus verschiedenen Blickwinkeln.
VSCO
VSCO stellt VSCO Hub vor, eine Job-Matching-Lösung für Unternehmen, um die richtigen Fotografen für ihre Projekte zu finden. Diese neue Funktion beinhaltet eine KI-gestützte Suchhilfe, die Fotografen mit spezifischen Anforderungen zusammenbringt.
OpenAI
OpenAI hat einen Deepfake-Detektor auf den Markt gebracht, der KI-Bilder aus seinem DALL-E-Modell mit einer Genauigkeit von 98,8 % identifizieren kann. Dieses Tool funktioniert gut, weil OpenAI den DALL-E 3-Bildern fälschungssichere Metadaten hinzufügt.
OpenAI
OpenAI erforscht Möglichkeiten, wie Nutzer verantwortungsvoll KI-Pornos erstellen können, um sicherzustellen, dass die Inhalte nicht gegen Gesetze oder Rechte verstoßen. Mit diesem Schritt wird die Bedeutung kreativer Inhalte, die Sexualität oder Nacktheit beinhalten, für einige Nutzer anerkannt.
TikTok
TikTok wird damit beginnen, KI-generierte Inhalte mit Content Credentials zu kennzeichnen und ist damit die erste große Social-Media-Plattform, die den offenen C2PA-Standard unterstützt. Diese Kennzeichnung wird auch zu KI-Inhalten mit Wasserzeichen von außerhalb von TikTok hinzugefügt.
Die rasanten Fortschritte in der KI-Technologie verändern die Foto- und Videobranche dramatisch. Dank der Initiativen von Google, OpenAI, Apple und anderen werden die Möglichkeiten zur Erstellung und Verwaltung visueller Inhalte immer ausgefeilter und leichter zugänglich.