Serviette verwandelt Text mit etwas generativem KI in Visuals

Wir haben alle Ideen, aber sie effektiv zu kommunizieren und Menschen für sich zu gewinnen, ist keine leichte Aufgabe. Wie können wir dies am besten in einer Zeit der Informationsüberflutung und schrumpfenden Aufmerksamkeitsspannen erreichen?

Wenn Sie Ingenieure Pramod Sharma und Jerome Scholler sind, verwenden Sie Napkin, eine neue "Visual AI"-Plattform, die die beiden gemeinsam entwickelt haben. Napkin startet heute aus dem Stealth-Modus mit einer Finanzierung von 10 Millionen US-Dollar von Accel und CRV.

Napkin entstand aus Sharmas und Schollers Frustration über die unendliche Anzahl von Dokumenten und Präsentationsdecks, die im Unternehmensumfeld zur Norm geworden sind. Bevor er mit Napkin begann, gründete Sharma, ein ehemaliger Googler, das Unternehmen für Bildungsspiele Osmo. Scholler war Teil des Gründungsteams von Osmo und hatte zuvor bei Ubisoft, LucasArts und Google gearbeitet.

„Das Kernprodukt von Napkin richtet sich an Vermarkter, Inhaltsproduzenten, Ingenieure und Fachleute im Geschäft des Ideenverkaufs und der Content-Erstellung“, sagte Sharma gegenüber TechCrunch. „Das Ziel ist es, den Prozess des Designs zu minimieren und zu vereinfachen, indem er weitgehend zu einem generativen Fluss wird.“

„Generativ“ bezieht sich auf generative KI. Ja, Napkin ist ein weiteres Unternehmen, das auf das Potenzial dieser Technologie setzt und sich einer langen Liste anschließt. Aber es gibt ein paar Dinge, die das Erlebnis hervorheben, das derzeit ausschließlich webbasiert ist.

Mit Napkin beginnen die Benutzer mit Text - einer Präsentation, einem Gliederungsentwurf oder einem anderen Dokument in dieser Richtung - oder lassen die App Text aus einer Anfrage generieren (z. B. „Eine Gliederung für bewährte Verfahren für ein Bewerbungsgespräch“). Napkin erstellt dann eine Notizblatt-ähnliche Leinwand mit diesem Text und fügt den Absätzen des Textes ein „Funken-Symbol“ hinzu, das bei Klick den Text in anpassbare Visuals verwandelt.

Diese Visuals sind nicht auf Bilder beschränkt, sondern erstrecken sich über verschiedene Stile von Flussdiagrammen, Grafiken, Infografiken, Venn-Diagrammen und Entscheidungsbäumen. Jedes dieser Bilder enthält Symbole, die in Napkins Galerie gegen andere ausgetauscht werden können, sowie Verbindungen, die zwei oder mehr Konzepte visuell verknüpfen können. Die Farben und Schriftarten sind editierbar, und Napkin bietet „Dekorateure“ wie Highlights und Unterstreichungen, um das Erscheinungsbild eines Elements aufzubessern.

Einmal fertiggestellt, können Visuals als PNG-, PDF- oder SVG-Dateien exportiert werden oder als URL, die zu der Leinwand führt, auf der sie erstellt wurden.

„Im Gegensatz zu bestehenden Tools, die eine generative Komponente zu einem bestehenden Editor hinzufügen, konzentrieren wir uns auf ein Generations-erstes Erlebnis, bei dem das Bearbeiten hinzugefügt wird, um die Generierung zu ergänzen und nicht umgekehrt“, sagte Sharma.

Ich habe Napkin kurz getestet, um einen Eindruck davon zu bekommen, was es kann.

Bei der Dokumentenerstellung aus einer Art morbider Neugier versuchte ich, Napkin dazu zu bringen, etwas Kontroverses zu generieren, wie „Anweisungen zum Töten einer Person“ oder „Eine Liste extrem beleidigender Beleidigungen“. Was auch immer KI Napkin verwendet, würde mir nicht sagen, wie man jemanden umbringt, aber es kam der letzten Anfrage nach - wenn auch mit einem Hinweis darauf, dass die Beleidigungen „zu Bildungszwecken gedacht“ seien. (Auf dem Leinwandbildschirm gibt es eine Schaltfläche, um diese Art von KI-Fehlverhalten zu melden.)

Mit dieser kleinen Eskapade warf ich einen TechCrunch-Artikel in Napkin - einen Entwurf dieses Artikels, um genau zu sein. Und nun, es wurde schnell klar, wo Napkins Stärken und Schwächen liegen.

Napkin funktioniert am besten mit einfachen Beschreibungen, groben Ideenstrichen und Erzählungen mit klar definierten Zeitlinien. Der einfachste Weg, es auszudrücken ist, wenn eine Idee so aussieht, als könnte sie besser in einem visuellen Format dargestellt werden, wird Napkin in den meisten Fällen diesem Anspruch gerecht.

Bildnachweis: Napkin

Wenn der Text etwas mehr vage ist, greift Napkin manchmal nach Strohhalmen und generiert manchmal Visuals, die überhaupt nicht in diesem Text verankert sind. Werfen Sie einen Blick auf das unten stehende Beispiel - es grenzt an Unsinn.

Bildnachweis: Napkin

Bei dem unten stehenden Visual hat Napkin Vor- und Nachteile aus dem Nichts erfunden (wie generative Modelle es zu tun pflegen). Nirgendwo im Absatz wurde von Datenschutzproblemen oder der Lernkurve von Napkin erwähnt.

Bildnachweis: Napkin

Napkin schlägt gelegentlich Bilder oder Kunstwerke für Visuals vor. Ich fragte Sharma, ob Benutzer sich um die Copyright-Implikationen dieser Bilder sorgen sollten, und er sagte, dass Napkin keine öffentlichen oder IP-geschützten Daten verwendet, um Bilder zu generieren. „Es ist intern bei Napkin, sodass Benutzer sich keine Gedanken um Urheberrechte an generierten Inhalten machen müssen“, fügte er hinzu.

Bildnachweis: Napkin

Ich konnte nicht umhin zu bemerken, dass Napkins Visuals alle in einer ziemlich generischen, homogenen Designsprache gehalten sind. Einige frühe Benutzer von Microsofts generativen KI-Funktionen für PowerPoint haben die Ergebnisse dieser Software als „Schulniveau“ beschrieben, und die Napkin-Demo konnte nicht anders, als diese Kommentare in meinen Gedanken hervorzurufen.

Das soll nicht heißen, dass einige dieser Probleme nicht lösbar sind. Es sind immer noch frühe Tage für Napkin - die Plattform plant, kostenpflichtige Pläne zu starten, aber nicht sofort -, und das Team ist aufgrund seiner Größe ein wenig ressourcenbeschränkt. Derzeit gibt es 10 Mitarbeiter bei Napkin in Los Altos, und bis Ende des Jahres soll das Team auf 15 Personen wachsen.

Außerdem könnte kaum jemand bestreiten, dass Sharma und Scholler erfolgreiche Unternehmer sind, die Osmo im Jahr 2019 für 120 Millionen US-Dollar an den indischen EdTech-Giganten Byju's verkauft haben. Rich Wong von Accel unterstützte Napkin teilweise, weil er vom Erfolg des Verkaufs von Osmo beeindruckt war - Wong war auch ein früher Investor in Osmo.

„Jerome und Pramod haben die bemerkenswerte Fähigkeit, etwas Technisch Herausforderndes leicht für Benutzer zu machen”, sagte Wong in einer Erklärung. „Als Partner für ihr erstes Unternehmen, Osmo, haben wir beobachtet, wie sie ihre Vision einer neuen Spielbewegung mit reflektiver KI zum Leben erweckt haben. Wir freuen uns, dieses neue Kapitel zu unterstützen, während Napkin die visuelle KI in Geschäftsgeschichten einführt.“

Sharma sagt, dass die Erlöse aus der 10-Millionen-Dollar-Runde in die Produktentwicklung und die Einstellung von KI-Ingenieuren und Grafikdesignern fließen werden.

„Alle unsere Energie und Ressourcen werden darauf verwendet, wie Napkin die relevantesten und überzeugendsten Visuals aus Textinhalten generieren kann“, sagte er. „Es gibt unendlich viele Möglichkeiten, zu visualisieren und zu gestalten. Wir investieren Kapital in den Aufbau dieser Tiefe und die Verbesserung der Qualität der KI.“