wie wir der Cloud beigebracht haben, Fotos nach Gesichtern zu sortieren / Sudo Null IT News

Viele Menschen nutzen Cloud-Dienste, um Dateien mit Freunden und Familie zu teilen: Laden Sie sie einmal in die Cloud hoch, öffnen Sie den Zugriff über einen öffentlichen Link und senden Sie sie an jeden, den Sie möchten. Wir bemühen uns, den Benutzern die Arbeit mit der Cloud zu erleichtern und analysieren regelmäßig, welche Informationen sie teilen und welche Dateiformate sie hochladen. Wenn Sie schon einmal mehrere hundert Bilder von einer Firmenfeier oder einem geselligen Beisammensein auf der Suche nach Ihrem Lieblingsgesicht durchgesehen haben, dann wissen Sie, was für eine mühselige Aufgabe das ist.

Wir – Sergey Tarasenko, Produktmanager für Cloud und Disk-O, und Arseniy Zorin, Leiter der Backend-Entwicklungsgruppe – werden über ein neues Tool sprechen, das Benutzern Zeit spart: das automatische Sortieren von Fotos in einem Ordner nach Gesichtern. Präzise Sortierung: Sie können Bilder mit bestimmten Personen schnell auswählen, aber nicht identifizieren.

Schnittstelle

Das Tool funktioniert sehr einfach: Sie erstellen einen Ordner, laden Fotos dorthin hoch, und Personen, die den Ordner über einen öffentlichen Link aufrufen, haben einen Filter zum spontanen Sortieren von Fotos nach Gesichtern. Bisher funktioniert das Sortieren nur in der Web-Version der Cloud, weil die meisten Nutzer damit arbeiten; Die Funktion wird bald in mobilen Clients erscheinen.

Es gibt eine andere Möglichkeit, die Sortierung nach Gesichtern zu verwenden: Öffnen Sie ein Foto in der Cloud im Vollbildmodus und klicken Sie auf eines der Gesichter darauf – Sie erhalten alle Fotos mit dieser Person aus diesem öffentlichen Ordner. Und da im Durchschnitt mehr als 4 verschiedene Personen pro Ordner vorhanden sind und beide Sortiermöglichkeiten mittlerweile ungefähr gleich stark genutzt werden, halten wir das neue Feature für sinnvoll und gefragt.

Wie es funktioniert

Das neue Feature basiert auf dem seit mehreren Jahren vom VisAPI-Team entwickelten Gesichtserkennungsmodell, mittlerweile ist die vierte Version im Einsatz. Sie hat sehr viele Möglichkeiten: Das Model kann Gesichter stricken, die teilweise von Hüten, Sonnenbrillen und Schals verdeckt werden. Er kann sogar ein halb gedrehtes Gesicht erkennen. Und bei jedem Foto merkt sich das System, ob die Person lächelt und wie gut ihr Gesicht zu sehen ist.

Das Modell nutzt die Prinzipien der Clusteranalyse: Je mehr Gesichter einer Person es sieht, desto besser vergleicht es sie – im Profil, mit vollem Gesicht, halb gedreht, teilweise verdeckt.

Da der Zugriff auf Ordner über öffentliche Links allen offen steht, kann deren Belastung recht hoch sein. Um dies zu reduzieren, haben wir uns entschieden, die Aktualisierungshäufigkeit zu begrenzen und die Ergebnisse der Sortierung nach Gesichtern in einem separaten Sharded-Speicher auf Basis von Redis zwischenzuspeichern. Was bedeutet das? Wenn der erste Benutzer auf einen öffentlichen Link zugreift, findet das System Gesichter in den darin enthaltenen Fotos, sortiert die Dateien und sendet das Ergebnis an den Benutzer. Dieses Ergebnis wird im Cache gespeichert und die nächsten Benutzer, die dem Link folgen, erhalten es sofort. Aber Dateien in Ordnern können geändert, hinzugefügt und gelöscht werden, also haben wir die automatische Cache-Invalidierung mit einer bestimmten Häufigkeit hinzugefügt. Auch wenn mehrere Benutzer einen Ordner besuchen, für den noch kein Cache erstellt wurde, wird die Sortierung dennoch einmal generiert und zwischengespeichert.

Natürlich kann das Modell falsch sein. Aber heute wird so viel “geleckt”, dass die Genauigkeit der Arbeit 99% überschritten hat. Wenn der Benutzer bemerkt, dass das Modell oder die Fotos einiger Personen nicht übereinstimmen, können Sie dem System manuell die richtigen Bilder mitteilen. Da unser Modell – wie die überwiegende Mehrheit auf dem westlichen Markt – auf Fotos von erwachsenen Europäern trainiert wurde, kann es manchmal Fehler auf Fotos von Vertretern anderer Rassen und Kindern machen, aber wir verbessern die Arbeit mit ihnen allmählich. Kinder verändern sich zum Beispiel mit dem Alter, und unser Modell kann heute schon über einen Zeitraum von zehn Jahren dasselbe Kind auf Fotos erkennen.

Jetzt arbeiten wir aktiv daran, die Speicherleistung mit Datei-Meta-Markup zu verbessern – Informationen über den Inhalt einer Datei. Es enthält Informationen über Milliarden von Dateien: Für die Fotografie speichern wir Informationen über Gesichter, Objekte, Sehenswürdigkeiten, Geokoordinaten, “Coolness Rating” (oder visuelle Schönheit), Dekompositionsvektor. Letztere bewertet die Ähnlichkeit von Fotografien, wodurch wir nicht nur dieselben Bilder, sondern auch Rahmen mit unterschiedlichen Winkeln bestimmen können. Diese Daten ermöglichen es Ihnen, die benötigten Dateien schnell zu finden, und wir können Sammlungen von Erinnerungen erstellen, indem wir nur die besten Fotos auswählen und ähnliche ausschließen. Jetzt arbeiten wir an neuen ML-Markup-Modellen und der Unterstützung neuer Formate. Dazu werden wir die Speicherarchitektur ändern, um die angeforderten Daten schneller zu finden und zurückzugeben. Die neue Architektur ermöglicht es Ihnen, täglich zig Millionen Dateien zu markieren, und die Meta-Markierung in den neuen Abschnitten der Cloud liefert noch schneller Informationen über Dateien.

Was ist mit der Informationssicherheit?

Um es gleich klarzustellen: Die neue Funktion identifiziert in keiner Weise Gesichter auf Fotos und vergleicht Bilder nicht mit dem Besitzer des Cloud-Kontos. Es findet nur Gesichter auf Fotos, vergleicht sie miteinander – ohne auch nur den Versuch zu machen, sie zu identifizieren :), – und trifft eine Auswahl für den Benutzer mit Bildern, die gemäß dem Modell des maschinellen Lernens dieselbe Person enthalten. Das heißt, das System findet nur ähnliche Gesichter im öffentlichen Ordner.

Auch wenn Sie in Ihrem Cloud-Konto Ihren Namen eingetragen haben, führt Sie die Sortierung nach Gesichtern nicht zu Fotos in öffentlichen Ordnern, da diese Daten auf architektonischer Ebene nicht miteinander in Beziehung stehen.

Die Funktion gilt nicht einmal für andere Ordner in Ihrer Cloud. Und Sie können keine Fotos mit Personen in den öffentlichen Ordnern anderer Personen finden, selbst wenn Sie sein Porträt in die Cloud hochladen – um zu sortieren und eine Auswahl zu erhalten, müssen Sie den Link zu einem bestimmten Ordner kennen. Sie müssen sich also keine Sorgen machen, dass jemand durch die Cloud geht und herausfindet, was Sie letzten Sommer getan haben.

Similar Posts

Leave a Reply

Your email address will not be published.