Computer Vision

Shownotes

Wie bringt man Maschinen das Sehen bei und in welchen Gebieten kommt diese Technologie zum Einsatz? Matthias Richter hat über das Thema promoviert und unterhält sich in dieser Episode mit Wolfgang Schoch.

Computer Vision beschreibt das maschinelle Erkennen und Analysieren von Bilddaten, oder ganz allgemein: das elektromagnetische Spektrum räumlich zu verarbeiten.


Links aus der Folge:

Für diese Folge von Digital Future gibt es ein vollständiges Transkript. Dieses Transkript wurde automatisiert erzeugt und nicht nachbearbeitet oder korrekturgelesen. Es wird daher sicher Fehler enthalten. Das Transkript ist als Ergänzung zu verstehen, um beispielsweise die Inhalte durchsuchbar zu machen. Im Zweifel gilt immer das gesprochene Wort aus der Folge.

Dieser Podcast lebt von deinem Feedback! Melde dich gerne über die verlinkten sozialen Medien oder direkt per Mail an podcast@inovex.de.

Wenn dir der Podcast gefallen hat, abonniere ihn und erzähl deinen Freunden davon! Außerdem freuen wir uns über deine Text- und/oder Sternebewertung bei Apple Podcasts.

Twitter: https://twitter.com/inovexgmbh Instagram: https://www.instagram.com/inovexlife/ www.inovex.de www.inovex.de/blog

Transkript anzeigen

00:00:00: Intro

00:00:07: Hallo und herzlich willkommen zu digital future dem inovex Podcast,

00:00:11: mein Name ist Wolfgang Schoch und ich bin agile Coach bei inovex ich habe hier aber auch schon als Softwareentwickler, Experte für Suchtechnologien und dem Sales-Team gearbeitet,

00:00:21: ich freue mich euch in jeder Folge eine Kollegin oder einen Kollegen vorzustellen und mich mit ihnen über ihr Fachgebiet zu unterhalten zu erhaltet ihr einen Einblick in unseren technologischen und Unternehmenskultur allen Alter,

00:00:33: in der heutigen Folge unterhalte ich mich mit meinem Kollegen Matthias Richter er beschäftigt sich mit dem Thema Computer wischen in unserem Gespräch klären wir erstmal was hinter diesem Begriff eigentlich steckt,

00:00:44: und dann reden wir über konkrete Anwendungsfälle und Projekte an denen Matthias gearbeitet hat und darüber welche Rolle Computerwissen auch in der Zukunft spielen wird ich wünsche euch viel Spaß mit dem Gespräch.

00:00:55: Hallo Matthias schön dass du da bist und ich freue mich dass man mit einem richtig coolen Thema ins Jahr 2023 starten und zwar wollen wir uns heute ja über Computer wischen unterhalten,

00:01:06: klingt ziemlich cool ich bin überzeugt dass du heute auch da richtig coole Sachen drüber erzählst aber bevor wir einsteigen stelle ich doch mal bitte VOR wer wirst du,

00:01:15: Warum beschäftigst du dich mit Computer wischen und was machst du bei uns hier bei inovex.

00:01:20: Hallo Wolfgang ich freue mich jetzt so sein ich bin seit dem ersten 120199 uvex als Maschine und den Kindern ihr dabei.

00:01:29: Und mache jetzt auch alles möglich in davor habe ich mich allerdings relativ ausführlich mit Computerviren beschäftigt deswegen gehen wir heute darüber und sagen dass bei mir eigentlich schon los und Studium oder darf ich als.

00:01:44: Studienarbeit damals noch versucht Licht Ausdrücke und Augen auf Fotos zu erkennen Kinder weiter mit der Diplomarbeit da habe ich dann versucht irgend verpflichtend weiter zu analysieren,

00:01:55: Und wenn wir dann das mit dem Studieren und den Computer wir schon so viel Spaß gemacht hat habe ich gesagt okay dann meinen unterbrechen dran,

00:02:01: und da habe ich dann bisschen mehr die Ingenieure Seite von der Computer wischen kennengelernt dann wohl versucht haben Sortiermaschinen.

00:02:11: Kennst Leitung von Galileo oder so einfach Maschinen die versuchen.

00:02:18: Welche Produkte nach guten schlecht zu sortieren zum Beispiel hätte man also das bei der nähe z.b. wäre,

00:02:27: hausfabrik,

00:02:29: und du möchtest natürlich nur das gute Pommes drin sind und nicht die mit den schwarzen stellen und dann hast du einen großes Förderband da gehen die Pommes in der Gruppe und brückenkamera die guckt auf die Pommes drauf,

00:02:39: und weiter hinten ist nun bald mit Luftdüsen und der schießt alle Promis die im schwarzen Fleck drauf haben aus.

00:02:45: Okay cool ja ich glaube ich habe sowas auch schon gesehen ich erinnere mich an Zone Galileo Folge da ging es um so eine Recycling Fabrik wo irgendwie so die ganzen Sachen aus dem gelben Sack sortiert wurden,

00:02:58: Star wurden glaube ich in die Glas oder Plastik auch mit mit seiner Kamera irgendwie erkennt erkannt und dann um seine Luftdüse vom Band runter geblasen.

00:03:07: Genau das war auch tatsächlich was was ihr dort gemacht hatten Glas Sortierung,

00:03:11: dabei geben die Idee wie man das sind alles sehr sehr händische System noch gewesen mit sehr sehr viel Einstellungen von irgend welchen Experten die dann zwei Tage lang enttäuschen gedreht haben,

00:03:24: aber die Idee kann man da machine learning benutzen um diesen Prozessen bisschen schneller und auch besser zu machen und damit habe ich mich dann noch eine Weile beschäftigt.

00:03:33: Namaz und gut und dann bin ich eben zu den Wechsel komme.

00:03:37: Okay das heißt du bist direkt nach deiner promotion zu uns gekommen damals ok

00:03:43: und ähm das Thema computer vision dass ich möchte das nicht sagen verfolgt dich sondern begleitet dich ja noch immer

00:03:51: und am kannst du vielleicht mal definieren was man eigentlich unter Computerwissen versteht denn ich finde das ist so ein Begriff der so vielsagend irgendwie ist zu da kann man zu so viel darunter verstehen.

00:04:06: Ich habe vor kurzem noch meine Wikipedia rein geschaut und da steht sinngemäß drin dass es darum geht Bilder zu verstehen.

00:04:15: Bildinhalte zu verstehen und zu analysieren wie findet man bin gut gedacht weil eigentlich ist es ne interniert Wissenschaft die sich generell damit beschäftigt wie Bilder aufgenommen werden,

00:04:26: und wieder ein Bilder im Computer verarbeitet werden und die Informationen aus diesen Bildern extrahiert werden.

00:04:32: Wenn man ganz allgemein werden möchte kann man sagen es geht darum das elektromagnetische Spektrum räumlich zu verarbeiten.

00:04:39: Ru.ok.

00:04:40: Das ist so die Jedi allgemeingültig sensmeier Definition Dichter gefunden habe elektromagnetisches Spektrum großer Teil davon ist das Licht dass wir so Lebenswille Spektrums gesehen haben die normalen Farben.

00:04:55: Die ist kein Reinhold jetzt auch so tatsächlich gar nicht gibt gibt passieren Dummkopf also was ist eigentlich nur gibt sind sie in dieses Spektrum mit verschiedenen Wellenlängen und dann Energie die auf diesem Spektrum liegt.

00:05:07: Und ein Teil davon ihr schneiden uns mal raus mit Kameras üblicherweise so dass wir Pixel haben.

00:05:14: Und diese Pixel dient die Messen jeweils in Maintal von diesem Spektrum und auf dem Anteil von dem Ort und benachbarte Pixel.

00:05:25: Sind dann auch in dem Raum umgeben aachbad.

00:05:28: Ein Bild ist also eine Ansammlung von dem text an die irgendwelche Nachbarschaftsbeziehung haben und diese man ganz weit raus und dann irgend Sinn ergeben können Menschen da drauf schaut z.b. ist das eine Tasse,

00:05:40: und dem Weg also ich habe das Spektrum ich bringe das irgendwie ein Computer rein durch die kamera vorher auch durch in Optik.

00:05:49: Amateur diese Pixelwerte und aussehen und Excel Werten erkenne ich dann da es eine Tasse zu sehen das ist gut für türkischen dieser komplette weg.

00:05:57: Also im Prinzip genau das was unser Auge und so Gehirn anscheinend so super easy macht das jetzt mal in den Computer zu übertragen.

00:06:06: Also es geht darum wie das nachzubilden sobald auch nicht nur,

00:06:10: weil wir natürlich mit diversen Techniken nicht nur das visuelle Spektrum uns anschauen können sondern z.b. auch im Infrarotbereich gucken können das komplett Menschen der nicht wir können auch mal Frau Bereich gucken oder wir können noch ein bisschen weiter Augen,

00:06:23: in jede beliebige Richtung.

00:06:25: Vielleicht um das mal ein bisschen besser zu verstehen mit diesem ganzen Spektrum dass du da gerade erwähnt hast.

00:06:32: Das sichtbare Spektrum na ja dass das einfach da steckt so schon drin das ist das was wir mit unseren Augen sehen können aber wir können ja beispielsweise auch mit so einer Wärmebildkamera irgendwo drauf schauen

00:06:41: Das gibt's vom Energieberater kann man sich mit der Wärmebildkamera mal sein Haus von außen ablichten lassen und dann sieht man genau

00:06:48: dann Kinderzimmer da ist jetzt vielleicht irgendwie das Fenster gekippt da geht die ganze Wärme raus dann ist man mit den Kindern bisschen reden

00:06:54: dass die hier vielleicht weniger Lüften dass man hier bisschen Energie spart und das wäre ja jetzt auch ein Teil vom Spektrum den wir Menschen nicht sehen können

00:07:03: wofür man dann spezielle Technologie braucht um den sichtbar zu machen.

00:07:08: Oder anderes Beispiel Röntgenbilder ist auch elektromagnetische Spektrum ist sehr sehr hochenergetisch können wir als Menschen auch direkt nicht sehen wir brauchen halt dann noch ein Sensor dazwischen.

00:07:19: Und der dann Bilder gerne red die wir als Mensch wieder geendet passieren können wir können aber auch diese Sendung Funktion direkt nehmen an Computer und dann darauf annualisieren.

00:07:28: Und das wäre mal eben auch Computer geschn.

00:07:31: Wenn ich so drüber nachdenke dass das schon echt faszinierend wie du das beschrieben hast weil,

00:07:37: wenn ich für mich selber mal so überlege was habe ich sonst noch für cine ich ich kann ja auch noch hören dann dann höre ich welche Frequenzen durch mein Ohr oder wenn ich jetzt den Computer habe ich habe Mikrofon,

00:07:48: Mikrofone sind relativ einfach aufgebaut wenn man sich mal anschaut wie die technisch funktionieren das schwingt halt war es dann entsteht halt dadurch dass du das in elektrische Spannung Frequenz ich kann die abtasten und dann kann ich die alten wie interpretieren,

00:08:02: das nicht so super viel Magie in Anführungszeichen dabei aber wenn du jetzt über so Spektrum und Computer wischen erzählst,

00:08:11: ja es ist ein dreidimensionaler Raum ich habe dann so eine zweidimensionale,

00:08:16: Projektion in Form von in welchen Pixeln und dann herauszufinden oder zu interpretieren ist diese Pixel Wolke da auf diese Weise ist das jetzt eine Tasse oder ist es ein Blend Fleck oder ist das eine Ei oder ist das etwas anderes,

00:08:31: das ist schon echt ne naja Challenger.

00:08:33: Das Wetter will ich auch so dass ein Großteil von unserem Gehirn nur damit beschäftigt ist unsere visuellen Reize zu interpretieren also zumindest bei denen Menschen.

00:08:44: Und was er hat eben schon gesagt das ist ein unheimlich wichtiger sind für Menschen und der 60. auch so dass.

00:08:55: Fast alles in der Welt für eben jene Menschen gemacht hast aber deine Mum Computer interagierst machst es normalerweise beim Bildschirm,

00:09:01: wenn du an der Ampel stehst dann siehst du dass die Ampel auf Grün springt gibt mittlerweile natürlich auch diese schönen wasserdrang,

00:09:08: oder Audiosignale ist noch nicht den Menschen das machen kann aber wenn du weiter gehst du versuchst eine Straßenbahn einzusteigen muss ich den Knopf finden wo du drauf drücken muss das geht darüber dass du siehst.

00:09:20: Und unsere eiterndes deswegen ist auch diese ja dieser dieser Wunsch danach Computer,

00:09:27: neben diesen Themen sind auch beizubringen weil man damit dadurch dass so viel damit gemacht wird in der menschlichen Welt,

00:09:33: man dadurch natürlich dann auch relativ viel automatisieren könnte wenn man jetzt schafft Computern das beizubringen zu sehen.

00:09:41: Ja weil das halt einen Punktes wo man halt Menschen benötigt um die Wissen gewisse Aufgaben zu erledigen weil Menschen halt wenn sie nicht irgendwie eine körperliche Beeinträchtigung haben halt von Natur aus zwei sehr leistungsfähige Augen haben,

00:09:56: und alle Aufgaben als super gut erledigen können wo es darum geht Dinge zu erkennen.

00:10:02: Oder auch trotzdem von Müll sortieren geredet das natürlich auch etwas das macht man vor allem dadurch dass man sieht und das ist aber auch keine besonders angenehme Tätigkeit man sowas auch Ottoman diesem könnte der wäre sicherlich ein foto.

00:10:15: Ja klar also wenn wenn irgendwas Nähmaschine erledigen kann und die Menschen dafür halt vielleicht Tätigkeiten durchführen können die 14 stiften dass sie nur für die Leute dann ist das immer wenn ich ein super guter Use Case für Technologie einfach,

00:10:30: aber ich merk mir das übrigens erstmal mit den blinden Menschen und dann vielleicht können wir da am Schluss noch mal darauf zurückkommen denn in mir kam es direkt die Frage auf,

00:10:39: wie kann man denn black blinden Menschen mit Computerwissen helfen ich würde aber gerne bevor war dorthin springen mal mit dir vielleicht eine kleine Zeitreise machen,

00:10:49: und zwar sind wir jetzt hier im Jahre 2023 das klingt wie Science-Fiction passt dann vielleicht doch ein bisschen zu Computerwissen das wirkt manchmal ja auch wie Science-Fiction aber wenn wir mal in der Zeit zurückschauen am,

00:11:01: kannst du grob festlegen oder festmachen wo ist du die Ursprünge von der Computer wischen sind.

00:11:10: Ganz richtig festmachen kann ich nicht ist aber mein Fehler ich das nicht festmachen könnte aber es gibt 1 eigenes in den 60er Jahren da gabs ein Sommerprojekt von ich glaube es war die des Partners,

00:11:23: College oder Stamford Instrument wann die haben sie gesagt okay wir haben es hier diese Kameratechnik und es wäre doch mal schön wenn man.

00:11:32: Wenn man das mit Computern machen also Studentenleben.

00:11:39: Muss ich gedacht okay wir können über den Sommer als dies komplette Fell Computerwesen Objekterkennung in Bildern 2. Konto lösen hat er dich nicht funktioniert.

00:11:48: Aber das war so ein bisschen der Startschuss für dieses ganze fällt das mal eben mal guckt sie die können wir dann ingenieurtechnisch draufschauen um eben gewisse Probleme zu irgendwie zu erkennen was ist oder ein Bild zu sehen,

00:12:02: wo sind die Dinger auf dem Bild.

00:12:09: Ganzen Reihe von Techniken die sich immer weiter entwickelt hatten gerade was so angeht Objekte zu lokalisieren also objektdetektion zu machen und da gab es,

00:12:20: die eine Technik nennt sich swift das Konturen.

00:12:25: Sitzt steht für scale invariant Feature transform ohne jetzt da zu tief ins Detail gehen zu können was sie wollen das ist einfach eine Repräsentation die.

00:12:36: Weibchen im Bild zeigt in welche Richtung gehen die Kanten in den Bild und damit kann man sehr sehr viel machen,

00:12:44: damit kann man nämlich eben z.b. Weg befinden man kann auch zwei Bilder übereinander legen um die zu registrieren großes Panoramadach ist jetzt schon und so weiter,

00:12:52: das war einfach fragen was er sehr gut funktioniert hat war nur leider patentiert.

00:12:57: Also deswegen bin ich das weil das halt eine seid halt so Meilenstein war andererseits aber auch so ein bisschen.

00:13:05: Ja irgendjemand Gedanken der das dann auch gleichzeitig wieder ein bisschen verhindert dass man da mit Innovation macht.

00:13:11: Aber Patente sind doch was Gutes darf dich denn durch solche Patente zwingt man ja andere Leute neue Möglichkeiten und neue Wege zu finden und dadurch noch mehr Innovation zu ermöglichen oder habe ich das falsch verstanden.

00:13:23: Ach das ist doch dein anderes hast Du darauf machen also was ist was ist nächstes gab es ist das dann andere Techniken.

00:13:34: Mir gerade nicht sicher aber die eigentlich das Gleiche waren nur eine Sachen im Patent ein bisschen anders umgesetzt haben und das Patent umgehen hat dann nicht ganz so gut funktioniert,

00:13:44: aber im Grunde das gleiche.

00:13:49: Genau ja es wurde relativ viel Maschine und benutzt in den Bereich dann relativ lange mit Sport Vektor Maschinen rumgemacht und gab es die die hoax,

00:14:01: stream of oriented gradients um eben auch von Autokran Präpositionen korrekt zu lokalisieren und so weiter aber es startet gerade ein bisschen auf der Stelle,

00:14:10: bis dann irgendwann dieses Image dir Dimension at Datensatz rauskramen und die ersten Rosen die Blondine Folge kam.

00:14:19: Was ist denn der imagenet Datensatz.

00:14:21: Stirnriemen großer Datensatz von Bildern mit kategorisieren mit Kategorisierungen was auf diesen Bildern zu sehen ist.

00:14:28: Okay das heißt ich habe dann schon für meine Experimente im Prinzip einfach so richtig tolle Trainingsdaten mit mit Bildern wo drauf steht dass eine Katze drauf da ist ein Panzer drauf.

00:14:38: Und das war eben der erste richtig große Datensatz mit diesem Kategorisierungen auf ein bisschen metastruktur noch oben drauf und auch sehr sehr viele Kategorien davor waren Zimmer verhältnismäßig kleine Datensätze mit spotify,

00:14:52: 20.30 Klasse und Design mit starten nicht starten das halt einfach riesig aber vielleicht hat sich mittlerweile auch nicht mehr so groß und es Vergleich mit dem was heutzutage so gibt,

00:15:01: sag mal was war einer der Durchbrüche der dazu geführt dass dieses deep-learning richtig gut funktionieren konnte was daneben auch der der nächste große Durchbruch vor der gratis ein bisschen treibt,

00:15:12: was wir im Moment alles zu sehen was was da passiert ist eben dass man das jetzt als in neuronalen Netzen macht mit mit die blonde.

00:15:18: Wann war denn ungefähr dieser große Durchbruch damit es mir Menschen hat kannst du das so Jahrzehnte mäßig bisschen einsortieren.

00:15:25: Das war noch in den 20 Zehnern.

00:15:29: 20 Zähnen,

00:15:31: was ich mich jetzt halt gerade Frage wenn du sagst es hat in den Sechzigern angefangen und man hat dann schon relativ schnell Erfolgserlebnisse gehabt dass man so Kanten erkennen konnten dadurch auch Objekte schon lokalisieren konnte,

00:15:44: die Kameratechnik war doch noch nicht wirklich so super gut also wenn ich mir heute Bilder aus den Sechzigern anschaue dann ist es meistens eine ganz

00:15:51: trübe Suppe irgendwie also gerade wenn ich mir von den alten space Mission so Bilder anschaue denke ich ach guck mal das sind die ersten Bilder vom Mond

00:15:59: okay aber die Wunde live übertragen die sind nicht wirklich so so super hoch auflösen.

00:16:06: Der ist das eklig so also die Kameratechnik hat natürlich auch ein riesen großen Sprung gemacht einerseits was halt die Sensoren an sich angeht dass die Pixeldichte viel höher geworden ist.

00:16:21: Rita die die eine Kamera die du normalerweise sind ganz ganz kleiner Chip drin trotzdem ihre Megapixel Auflösung hat.

00:16:27: Er ist beeindruckend was mit so ganz modernen Handy ist heute möglich ist also das ist wirkliche Herr krass einfach.

00:16:34: Und das andere hör ist das auch die Optik ein riesen großen Sprung gemacht hat also,

00:16:42: Schatten wie bitte du dich mit Kameras auskennst aber früher hat man ja reden groß Objektive gehabt mit um welchen Linsensystem und so weiter,

00:16:49: jetzt auch wenn es ein Vergleich mit der Handykamera das Mini Linse direkt vor dem Schiff und du kannst damit trotzdem über Sachen machen kannst da,

00:16:57: kannst dort aber optisch Zoom du kannst auch jetzt softwarebasiert Rücken zu Fokusebene verschieben und so weiter,

00:17:05: und da passiert eben auch noch relativ viel.

00:17:08: Genau gibt er noch auf den OT kamera Seite die Möglichkeit dass du mit sehr sehr wenig Licht umgehen kannst also typisch also.

00:17:19: Müssen auf die Kameras zu kommen wie das funktioniert ist.

00:17:23: Deine deine Bildsensoren nice 117 ist einfach nur ein Sensor der Dennis die viel Licht ankommt und das in der Küche Signal umwandeln das ist abhängig davon wie viele ich reinkommt,

00:17:36: also wie gesagt das Licht ist und aber auch wie lange du den Sensor misst das heißt einerseits.

00:17:45: Kannst du sagen ok ich mir das jetzt hier eine Sekunde lang oder ich mir zwei Sekunden an und dann hast du eine rege halt doppelt zufällig Datum Sensoren doppelt zu Sparkasse klar dass es diese shutter speed,

00:17:56: und das andere halt wie die ja das Licht das jetzt Kameras die können einzelne Photonen messen mittlerweile die Seite erkennen wenn einzelne von Außensensor drauf kommt,

00:18:06: am anderen Tag ist ein bisschen elektro-bau-technik Magie die dann die das Signal so stark verstärkt das müssen Computer wieder messen kann.

00:18:16: Und das war natürlich damals auch nicht so damals einfach viel schlechtere Technik gehabt.

00:18:25: Mittlerweile viel Grad.

00:18:27: Okay aber ich meine liegen hatte ich auch viele viele Jahre dazwischen und,

00:18:30: ich kann mir das so wenn ich die Ingenieurs Brille Aufsatz zur schon vorstellen dass man da was du die Optik angeht Fortschritte gemacht hat dass man da liegt stärker geworden ist mit den Objektiven dass man es verkleinert hat dass man

00:18:42: vielleicht auch eine höhere Produktionsqualität bei solchen Linsen einfach hatte weil vielleicht waren die früher nicht so rein wie es ist vielleicht heute sind weg, die auch besser polieren oder besser schleifen

00:18:51: das ist ja gerade also ich habe sie vorhin schon mal von Weltraum Beispiel gemacht,

00:18:55: das ist ja beides vor Weltraumteleskop nimmer so ein ganz großes Thema dass die dann eigentlich fünf Jahre lang poliert werden damit die 100% Perfektion unwillig man auf Atomebene das alles akkurat hat und und dass das alles super ist damit es gut funktioniert und meine

00:19:09: möglichst gute Qualität hat.

00:19:12: Das wird Chips besser werden ja ich glaube das kann man auch wahrscheinlich gut nachvollziehen dann auch die CPU in meinem Laptop die ist heute viel besser wie in den 60er Jahren,

00:19:22: und da haben wir ja auch immer wieder in regelmäßigen Abständen neue Generation von ihm hin Chips und warum sagt man dem Kamerachip anders sein,

00:19:30: das heißt dann so zu seit den 60ern seit man sich damit beschäftigt wurde auf der einen Seite diese reine Technologie besser also die kamera Technologie wurde besser du kannst heute Bilder erzeugen mit auch Videos,

00:19:44: die eine höhere Auflösung haben die empfindlicher sind die dann vielleicht auch viel besser funktionieren wenn wenn es ein bisschen dunkler ist wenn du schlechte Lichtverhältnisse hast,

00:19:52: oder wenn Sie Dinge auch sehr schnell bewegen ist dass du gesagt man kann einzelphotonen messen das heißt ja,

00:19:58: dass du diese dieser Verschluss der Kamera ja nur sehr sehr kurz offen sein muss also dann nur eine,

00:20:05: ich bin zu schlecht in Mathe und das im Kopf auszurechnen aber Fotos sind verdammt schnell die Fliegen glaube ich sogar mit Lichtgeschwindigkeit also das heißt ja dann dass du in die auch 300.000 Bilder pro Sekunde mehr machen kannst und wie.

00:20:16: Wobei diese Färbung Kameras die werden er benutzt den Bereichen wo du halt wenig Licht hast bisschen wissenschaftlich nächsten wo du arbeitest einfach gefahren.

00:20:27: Okay also dann dann ist nicht in der Müllsortieranlage weil weil das Band so schnell läuft und.

00:20:33: Aber da ist es halt weil meins ist baden zu noch so schnell da ist das Essen Problem wie schnell die Sachen drüber laufen und wie schnell du dann deinen Vater schließt von der Kamera weil wenn es zu lange machst dann verwischen diese die Bilder.

00:20:47: Erkennt glaube ich jeder der eine Spiegelreflexkamera mein Inhalt in den Händen hatte ich habe mir mal eine gekauft vor was nicht vor 10 Jahren weil ich dachte hey jetzt für ein Urlaub da brauchst du mal eine gescheite Kamera und ich habe dann ganz viel mit dem Automatikmodus fotografiert es hat super funktioniert,

00:21:02: dann wenn ich von Hand irgendwie Belichtungszeiten eingestellt habe dann hat es immer irgendwie schlecht und auch sehr gern verwischt wenn die Belichtungszeiten über 5 Sekunden war aber wirklich ich mache gerade noch ein Foto das wird super super

00:21:16: aber ich glaube da kennt man es dann vielleicht Montag genau den richtigen Wert braucht.

00:21:21: Okay und jetzt hast du gerade auch noch gesagt dass dann so ab den 2010er Jahren auch machine learning eine größere Rolle gespielt hat und wo ich es gerade noch dran denken musste,

00:21:33: am

00:21:34: Kurz als Kaution Kultur Maschine und hat immer noch alle gespielt also bis auf ganze Anfänger aber was jetzt eine Rolle gespielt habe weil das gibt's doch nicht.

00:21:43: Ja stimmt sorry dann habe ich natürlich falsch falsch wieder jedes deep learning,

00:21:48: an und da musste ich jetzt schon gleich dran dran denken wenn es um deep learning geht so da denke ich direkt an

00:21:55: wir können jetzt irgendwie auf Fotos in die Kätzchen erkennen das ist glaube ich für das klassische Beispiel war das nicht auch so ein Projekt von Google als sie angefangen haben mit ihrem mit ihrem Bild erkennungs Geschichten.

00:22:06: Stoppelkatzen Aronia.

00:22:08: Ja ja genau da genau das dann da muss ich gerade dein,

00:22:11: Bantam wie hat sich denn das dann entwickelt mit diesem ganzen deep learning seid seit 2010 ungefähr oder seit den 2010er Jahren.

00:22:19: Es ist unglaublich explodiert mittlerweile gibt's eigentlich nichts mehr was nicht und Meditieren gemacht wird in der Computer wischen.

00:22:31: Nur mal kurz runtergehen wann hat typischerweise verschiedene Probleme sowie die klassischen Probleme mehr in der Computer wissen sind eben wie gesagt erkennen was es auf einem Bild drauf das ist normale Klassifikation dann erkennen wo ist das zu sehen was ist Deduktion.

00:22:46: Okay ganz kurz was ist auf meinem Bild drauf wär dann wirklich so was wie wo es ein Cattle wo ist ein Kätzchen auf welchem Bild oder ist ein.

00:22:53: Nee das ist schon Detektion.

00:22:54: Das sieht ja Sektion.

00:22:56: Der Klasse Kation wäre das ist ein Bild von einer Katze der Lektion wäre auf dem Bild ist eine Katze und sie ist ein Position 10/20.

00:23:06: Und dann gibt's noch Sequenzierung,

00:23:09: da versucht man einzelne Pixel zu klassifizieren das heißt ich sage jetzt Pixel 10-20 ist entwickelt jetzt an der Katze gehört Pixel 10.21 ist auch ein Pixel der so einer Katze gehört Pixel,

00:23:24: 30 42mm 60 cm und gehört.

00:23:27: Okay das heißt mit dieser segmentierungen der segmentation könnte ich jetzt wenn ich ein Foto habe auf der viele Dinge drauf sind und unter anderem auch eine Katze,

00:23:38: könnte ich genau herausfinden welche Pixel zu dieser Katze gehören und die beispielsweise auszuschneiden cool.

00:23:45: Klar liegt so eine Maske im Grunde über das.

00:23:48: Wo dann eben gezeigt wird an dieser Position ist jetzt dass dieses Objekt zu sehen ist im Grunde eigentlich aus einer Aktion nur halt bisschen feingranular an.

00:23:59: Bei der Aktion ist es halt in der Regel sondern Bounding Box man überlegt dass ein Rechteck und bei segmentierungs das halt eben frei.

00:24:07: Werden solche Technologien verwendet wenn ich beispielsweise in Photoshop mit dem Zauberstab auf auf ein Objekt drauf klickt und genau dieses Objekt dann markiert wird damit ich es ausschneiden kann oder löschen kann.

00:24:17: Also wahrscheinlich kein Piepton wenn man das hier einfacher vorgehen kann dann kannst du einfach gucken okay du hast es auf dem Excel geklickt er hat eine Farbe die ist ein bisschen leicht rötlich,

00:24:27: schick mir mal alle Pixel die eine ähnliche Farbe haben wo der Abstand zu dieser leicht rötlichen Farbe nicht zu groß ist.

00:24:34: Und bei den Zauberstab ist es ja glaube ich auch noch so dass du dann nicht über Grenzen hinweg ist das heißt wenn du Rennen,

00:24:42: ein rotes Bild dann hast du einen schwarzen Kreis drin und in drin ist wiederholt dann wird innen drin nicht.

00:24:47: Ja ja ja also mittlerweile funktioniert das echt gut mittlerweile kannst du auch Fotos nehmen da wo Personen drauf sind und du kriegst eine Person an mit diesem Tool und die Person wird meistens relativ,

00:24:58: genau dann wirklich auch markiert also mit auch mit Händen und Haaren und alle möglichen.

00:25:05: Ernte weiß jetzt nicht genau wie das gemacht wird ist gab aber auch so Energie mir nämlich uns verfahren die.

00:25:13: Optimierungstheorie die.

00:25:16: Da ganz abgefahrene Sachen gemacht haben um da ebenbeck Grenzen zu finden und aber auch um das anziehst ihn carving um Objekte auszuschneiden aus dem Bild die man nicht haben wollte.

00:25:28: Aber unabhängig davon ob das jetzt deep learning ist in Photoshop oder nicht dass es Computer wischen werden.

00:25:34: Okay cool dann aber jetzt habe ich gerade unterbrochen wir hatten es jetzt von den verschiedenen Methoden oder von den verschiedenen Anwendungsmethoden dies ergibt werden die die Segmentierung jetzt und wir hatten die Detektion und wir hatten noch die,

00:25:49: am das war das erste Identifikation die Klassifikation genau.

00:25:54: Was ist noch gibt es bei der Rekonstruktion,

00:25:57: habe meinen früher typischerweise gemacht mit also das in der Regel zwei Bilder aus leicht unterschiedlich Positionen sowie Mensch das auch macht mit seinen beiden Augen,

00:26:07: und da hat er früher gemacht zurückzufinden welche zwei Punkte in diesen beiden Bildern zusammengehören.

00:26:14: Und wenn man dann musst du wohl die Kameras waren konnte man so zwei Strahlen durch die kamera durchschießen und dadurch die 3D Position von diesem Punkt bestimmen.

00:26:23: Dass ich davon wusste obwohl ich dir dein Strahlen schneiden müssen.

00:26:31: Darüber euch man braucht man z.b. auch hilft und dann diese beiden Bilder übereinander zu legen von diesen Kameras und heutzutage macht man das auch mit Deep learning,

00:26:41: navigiere du Zucker Verfahren da gibt's nur ein einziges Bild rein und der gibt hier ein tiefenpilz zurück das Einkaufen Bild und da ist uns mal viel schwarz ist ganz fertig und weiß es ganz nah dran.

00:26:51: Okay mit einem einzigen Bild.

00:26:53: Das sind natürlich dann nur eine Schätzung aber diese Schätzung sind schon verdammt gut.

00:26:58: Okay das ist aber richtig krass dann funktioniert sowas auch bei so komplexen Gebilden wie es im menschlichen Gesicht.

00:27:06: Da kommt natürlich immer drauf an wie gut die Trainingsdaten sind hinten schmerzt.

00:27:09: Ja

00:27:11: Ich würde sagen ja also wenn dein Trainingsdatensatz sprechen gut ist dann müssen wir es auch funktionieren.

00:27:16: Hermann Trainingsdatensatz bitte dafür so aussehen dass ich jetzt Fotos von Gesichtern habe plus die die räumlichen Daten von dem Gesicht aus dem Laserscanner oder so.

00:27:32: Gibt's aus der Praxis Anwendungsfälle der Computer wischen die man vielleicht kennt aus dem Alltag und sich derer gar nicht so bewusst ist.

00:27:43: Fußballspiel was ein wirklich gar nicht bewusst ist ist wenn man es mal für ein QR-Code scannen mit dem Handy.

00:27:51: Okay ja.

00:27:53: Da wird nämlich erkannt auf diesem Foto ist ja so aufgebaut der hat in den Ecken so drei Blöcke und jeden Tag an den Computer wischen und dann wird das Bild richtig hingebogen und dann wird jeder gut interpretiert.

00:28:06: Also das ist jetzt ohne gar nichts machen sondern typische klassische Bildverarbeitung aber das ist eben auch schon komplett und so weit drinnen ist dass man das gar nicht mehr merkt dass das eigentlich.

00:28:17: Dann mittlerweile wenn du mit dem Handy ein Bild machst.

00:28:23: Werden oft wenn du Personen in dem Bild hast schon so Boxen um die Gesichter gemacht das gibt ein Portrait Modus bei Kameras die den Hintergrund dann Herr verfahr.

00:28:37: So unscharf machen danke.

00:28:38: Und was machen genau auf sobald sie halten Gesichtern erkennen das ist auch schon Computer wischen was da passiert.

00:28:45: Was heißt der wird sobald ich in den Fotomodus schalte vom Handy wird die ganze Zeit mit Computer wischen geschaut was ist das vielleicht von Motiv gibt's hier speziellen modus oder kann ich irgendwie Optionen anbieten.

00:28:58: Ich würde sogar argumentieren das was die Spiegelreflexkamera mit dem Automodus macht ist auch schon Computer wischen die versucht dein Bild scharf zu stellen.

00:29:08: Weil da dann mich gemessen wird wie scharf ist das Bild dass ich gerade auf einem Sensor habe und ich versuche jetzt die Optik so einzustellen dass das dieses Bild in Mitte scharf wird.

00:29:17: Ja stimmt da so meine Spiegelreflex sich habt ihr übrigens immer noch zu Hause,

00:29:22: habe damit auch einige Fotos gemacht und die ist auch ganz sicher über 10 Jahre alt das Gerät dass ich habe aber ja dieses automatisches Scharfstellen ja das hat er auch drin und da ist wahrscheinlich nicht so viel deep-learning drin.

00:29:38: Ruf an ruf an.

00:29:39: Es geht damit mit deinen Vorfahren ja aber ja das ist das ist ja dann auch Bildverarbeitung Bilderkennung interessant.

00:29:47: Anderes Beispiel ist Bildersuche wenn du bei google kannst ja rückwärtssuchen machen gibt ein Bild rein und er findet die Bilder die er nicht aussehen.

00:29:57: Das ist auch durch Computerviren Funktion so da wird in deinem David ein Bild umgerechnet in eine andere Präsentation,

00:30:08: und google hat eine Datenbank mit diesem Repräsentationen und wird einfach das nächste die nächsten Bilder zu dieser Präsentation gefunden.

00:30:16: Das ist dann aber für das ist dann aber eine Kombination aus ganz vielen Technologien oder also ich habe ein Bild ich gebe das rein meinem Computer wischen um,

00:30:26: das zu verarbeiten um da irgendwie Daten rauszuziehen vielleicht eine andere Repräsentation draus zu erzeugen dann gibt's heute nach aber noch Verfahren mit denen man dann diese Repräsentation in wie vergleichen kann oder,

00:30:39: ist das auch noch dass das Computerwissen immer noch ist wenn man wenn man seine Ähnlichkeit dann irgendwie berechnet oder oder herausfindet oder,

00:30:47: befinden uns dann schon irgendwo anders.

00:30:49: Sagt Mathematik dann nutze ich bedient sich aus ganz vielen Bereichen.

00:30:58: Das ist eigentlich ein klassischen Maschinentechnik die nächste Nachbarn suchen Candy bis neighbor,

00:31:03: und das Idee du hast was Datenpunkte und du musst Abstände zwischen diesen Daten. Und dann gibst du halt die nächsten 10 Datenpunkte zurück die Komponente die sogar dafür dann noch raus ist er die erste Tanzmaus.

00:31:18: Und dafür kannst du verschiedene Sachen nehmen du kannst es dir Notizen Abstand nehmen also die kürzesten Weg zwischen den beiden Punkten.

00:31:26: Bei so Bildern aber nur bedingt Sinn weil die Räume sehr sehr hochdimensional werden und dann wenn ich es Abstände wenig aussagekräftig also was man da macht ist den Winkel zwischen diesen beiden Vektoren zum Essen.

00:31:37: Natalie große muss das Tanzen weil die aussagekräftiger ist.

00:31:41: Okay aber das bedeutet dann doch aber trotzdem du hast Computer wischen und ein Teil davon da geht's darum dann irgendwie,

00:31:48: mit der Kamera was aufzunehmen die Pixel irgendwie zu verarbeiten dass ich deiner Repräsentation habe wenn ich jetzt aber irgendwelche Verfahren anwende um diese Daten auszuwerten.

00:31:58: Brauche ich aber doch trotzdem noch irgendwie Hintergrundwissen über die funktionieren Augen nicht funktionieren Bilder was soll ich denken Kopf gerade so ein bisschen an den Bereich NLP,

00:32:08: habe ich früher bisschen was gemacht und,

00:32:11: da ging es ja auch darum okay du musst es irgendwie erstmal Text in die bekommen das war meistens nicht so aufwendig wie es vielleicht der Computer wissen dass man keine Kameras gebraucht und meistens irgendwie noch in Excel importer vielleicht oder und in CSV importer um invitex zu bekommen oder fetter,

00:32:25: OCR dann wären auch schon im Bereich Computer wischen natürlich aber wenn man da jetzt rangegangen ist um da,

00:32:32: irgendwie wissen rauszuziehen oder Schlussfolgerungen zu treffen hat mir nämlich auch irgendwie Kenntnisse gebrauchte das Semantik z.b. und auch Kenntnisse über verschiedene Sprachen weil manche sprachen sehr sehr unterschiedlich funktionieren und man jetzt vielleicht mit,

00:32:46: wecke mich in asiatischen Sprachen dir ganz anderen Konzepten basieren wie das deutsche oder englische es vielleicht mit irgendwelchen Verfahren die im deutschen super funktionieren

00:32:55: nirgendwo nicht nicht hinkommt oder im deutschen hast du natürlich

00:32:58: riesengroße Wörter und so große Komposition aus Wörtern die Tickets für Sonntag der Welt und die Engländer die wie die Katzen sind im Kopf wenn Sie sehen dass wir Buchstaben 30 Wörter mit 30 Buchstaben haben also zwei

00:33:11: dann schon irgendwie so okay dass ein Verfahren du kannst wird es dann zum Berechnen etc

00:33:16: verbraucht es trotzdem immer noch viel Backgroundwissen über der Sprachen Sprachkonzepte dass der Computer wischen genauso oder.

00:33:23: War früher so,

00:33:25: das ist alles abgelöst wodurch das deep learning also was man früher gemacht hat war ganz viel dieses Feature Engineering eben dieses Geschäft oder auch die Hoax gab aber auch die Gabor Filter das war an,

00:33:40: Hühner die,

00:33:42: haben auch wieder einen ganzen erkannt haben in einem Bild die aber moduliert waren nachdem was im Gehirn tatsächlich passiert also man hat im Gehirn wieso ein cortex hat man mehrere Stufen,

00:33:54: und die erste Stufe das sind im Wesentlichen Kanten Elektronen.

00:33:59: Bei dir dann weiter verschaltet werden und diese Kanten Direktorin die hat man eben modelliert mit diesen Gabelfedern.

00:34:07: Und das hat man dann benutzt als Features für seine Maschine an den Verfahren mittlerweile macht man es aber nicht mehr sondern hat,

00:34:14: damals deconvolutional networks genommen mittlerweile macht man das auch als mit transform an aber geht diese Netze die lernen diese Filter automatisch,

00:34:24: das heißt man,

00:34:26: mach dieses low-level ich will gar nicht mehr machen sagt das nur noch hier ist ein großer Datensatz mit meinen Bildern und mit dem was ich raus haben möchte und die die wir nicht mal die Macht alles dazwischen.

00:34:37: Wo bleibt denn da der Spaß.

00:34:40: Okay das wusste ich nicht also ich kenne so diese was du gerade angesprochen hast ist ja ich hoffe ich spreche es richtig aus convolutional neural neuronal,

00:34:49: die vier nennst genau das kenne ich noch da gar einer ich mich auch einen Studenten hier bei uns der hat da mal vor,

00:34:58: mittlerweile auch schon drei vier fünf Jahre her aber ganz ne Masterarbeit drüber geschrieben du bist meine Masterarbeit und ein Vortrag drüber gehalten und das fand ich auch ganz interessant dann,

00:35:08: da war das ja genauso wie das gerade gesagt hast mein hat zugleich diesen ersten Level wo man fällt mähkanten detektiert und aufbauend auf den Informationen schaut mal was ist das nächste was irgendwie Sinn macht und,

00:35:18: wenn man das alles zusammen packt hast dann Schluss halten System wo Kätzchen erkennt oder Menschen oder Hände oder irgendwas anderes.

00:35:25: Das gibt's heute in der Praxis nicht mehr in der Granularität.

00:35:29: Kommt drauf an.

00:35:31: Beste Antwort für alle technischen Fragen.

00:35:34: Das habe ich einfach damit ich das sagen kann mit Stempel.

00:35:37: Stimmt immer du bist Doktor dir den Nemesis auch ab.

00:35:40: Also es gibt einfach Anwendungsfälle da kann man die burning aus praktischen Gründen nicht machen das war eben auch das womit ich mich beschäftigt hatte Promotion diese Sortiermaschinen die Dartmann.

00:35:55: 16 Millisekunden Zeit Bild aufzunehmen und entscheiden zu treffen und im Ding auszusortieren da kann ich keinen.

00:36:03: Dann würde ich nur noch alle Knochen als nicht schieben dass das dauert einfach zu lange,

00:36:08: man dreht sich dann da mit anderen Sachen dass man einerseits halt klassische Bildverarbeitung macht,

00:36:13: hat diesen typischen Kita berechnen gibt es auch Vitus die sehr sehr schnell berechenbar sind zum Beispiel die local binary patterns aus dem kalten Direktorin oder einfach die Farbe von von Dingen.

00:36:24: Um diese Sachen im schnell zu machen haben wenn man in dem Bereich geht kann man tatsächlich überhaupt mit der Optik spielen also wenn ich sage ich will Pommes erkennen die dunkle Stellen haben,

00:36:35: dann kann ich die Beleuchtung so machen dass Pommes in den Bild gar nicht mehr auftauchen und wenn er noch bestellen sind dann ist aber dunkles und dann weiß ich immer wenn es dunkel ist und sie sich drauf.

00:36:45: Muss ich gar nicht mehr rechnen.

00:36:46: Du hast du hast vorhin gesagt also ich deiner promotion hingegeben hast da fandest du auch zu diesen Ingenieurs in suspect spannend und das ist aber doch dann der Ingenieurs Aspekt in Reinform oder,

00:36:57: ich verändere die Beleuchtung damit ich vielleicht gar nicht so viel rechnen muss sondern dass es eine einfach lösbare Aufgabe wird.

00:37:04: Jetzt kann man das noch kompliziert machen.

00:37:08: Wenn man Wer ist Computer Spektrum.

00:37:12: Was ja abgesagt Farben gibt es eigentlich gar nicht das passiert im Kopf eigentlich was ist eine gibt's in diese steckt drin die im Energie über verschiedene,

00:37:21: Bereich von diesem Spektrum definieren und man kann jetzt eine Beleuchtung machen die in ganz komplizierten spektral Verlauf hat.

00:37:28: Die dann aber bestimmte Sachen in meinem Bild in mein Material Leuchten ist und sowas kann ich aufbauen und jetzt kann ich mir aber.

00:37:38: Wie komme ich zu diesen Schrecken was ich beleuchten möchte und dafür kann ich dann wieder Computerwissen und machine learning einsetzen dass ich mir berechne wie muss diese Spektrum aussehen damit das in den Bild leuchtet was ich machen möchte brauche ich da.

00:37:52: Sollst du nutzt dann wirklich Rechenpower um das zu optimieren das ist ja im Prinzip keine Optimierungsaufgabe dass du weißt wie muss das ausgerichtet sein mein Spektrum wie muss das aussehen damit ich es möglichst schnell und möglichst sicher erkennen ganz cool.

00:38:08: Ich finde das so cool weil das ja dann wirklich sowas interdisziplinäres ist du hast dann jemanden der Experte irgendwie ist für machine learning du hast Leute die sich mit Optik auskennen,

00:38:22: cool,

00:38:24: ja Matthias wenn wir mal vielleicht auf dein Alltag schauen wenn du dich jetzt beruflich mit dem Bereich Computer wischen beschäftigst am,

00:38:34: was gibt's denn da für klassische oder oder typische Use-Cases mit denen du konfrontiert wirst dass du hast schon sowas angesprochen wie QR Code Erkennung ich glaube da gibt's wahrscheinlich heute schon genug brainworx die man einfach benutzt das wahrscheinlich nicht mehr in ihren müssen,

00:38:48: aber was hinten zu in den echten Projekten in den du arbeitest so Anwendungsfälle wo mal wo wir ihn wieder eigene Computer wischen basierte Lösung.

00:38:58: So ein schönes Projekt auch relativ am Anfang meiner Zeit bei unterwegs das war mit spots heiß,

00:39:04: die haben eine App entwickelt mit der kann man mit seinem iPhone das hat er so ein 3D Sensor dran kann man sein Fuß abscannen,

00:39:12: 3D Modell aus diesem Fuß generiert und dann wird er rechnet die großen Schulen muss der auf diesen Fuß passt.

00:39:19: Was ich für dich gemacht haben ist zu erkennen ist ein Fuß auf dem Bild das jetzt dieser Scan gestartet werden kann ist ja in der richtigen Position.

00:39:29: Und ist ja ja richtig weit weg.

00:39:33: Und da wir verschiedene Sachen probiert ja mehr versucht mit diesen Punktwolken ranzugehen an die da auf dem iPhone raus fahren dann kann man dann auch direkt auf jeden. Irgend.

00:39:42: Ja die Planung draufmachen,

00:39:44: am Nachmittag aber auch ein Bild castigator, als wären gesagt wir haben Bilder und da drauf ist ein Fuß zu sehen oder es ist kein Fuß zu sehen.

00:39:56: Typische Klasse geboren.

00:39:58: Okay das heißt ihr habt dann gar nicht diesen 3DS and so verwende das glaube ich diese Lieder sind so oder iPhone.

00:40:03: Erinner mich Lieder Lieder ist mit Lasern das ist zu teuer aber die Idee ist du hast einen Punktmuster in Infrarot was der Mensch ihn nicht sieht und dann hast du eine Infrarotkamera dieses. Musst aber sieht und die Info und,

00:40:17: hinten dran weißt du wie das. Musste auszusehen hat wenn es auf eine glatte Fläche fällt und dadurch dass es nicht so aussieht dass du manche Punkte woanders sind kannst Du eben ghedira Deformation zurückrechnen.

00:40:27: Arceus hast doch die Verzerrung von dieser eigentlich flachen Projektion von diesen Punkten kannst du berechnen wie das wie das dreidimensional aussehe.

00:40:35: Genau das ist gleich was aus Kinect gemacht hat damals.

00:40:37: Adi kenne ich noch von Microsoft für die Xbox damals.

00:40:41: Übrigens ein gutes Beispiel dafür hat mir am Anfang über die Patente gutes Beispiel dafür wie durch Patente Innovation getrieben wird denn es gab für diese 3D Steuerung damals ich glaube erstmal Nintendo mit der Wii,

00:40:53: die hatten dieses Emotion Sensoren in diesen in diesem Joysticks drin die man sich.

00:40:57: Was auch immer und hat es funktioniert.

00:40:59: Dann gab's danach gabs der Kinect von Microsoft und es gab auch noch von Sony Modell das die schlechteste war denn es gab.

00:41:08: Erben Sony gab es auch von der Adria Joystick dabei eine leuchtende Kugel drauf,

00:41:14: und hast du eine Webcam gehabt an deinem Fernseher und der hat dann diese leuchtende Kugel getrackt und hat dann berechne wie du deine Hände gerade bewegst,

00:41:21: und das hat niemand gemacht weil als getan unendlich waren hässlich ja vielleicht ist es doch nicht so gut mit den Patenten aber das ist ein Thema für den neue Patente podcast.de vielleicht irgendwann mal kommt,

00:41:33: genau.

00:41:35: Okay das heißt ihr habt für das Projekt einfach dann was entwickelt wo man dann mit Hilfe von den Fotos zu den Videos die man jetzt mit dem Handy machen konnte quasi erkennen konnte ist der überhaupt ein Fuß irgendwo sich,

00:41:48: und er ist ja auch richtig positioniert damit dann die existierende Technologie von dem Kunden diesen Fuß vermessen konnte okay cool.

00:41:57: Wir haben doch eine Kampagne gestartet dass wir tatsächlich Bilder von ganz schön fügen genommen haben und dann damit eben einen existieren aus Modellnummer nach zu trainieren ein Ford Turnier zum Hotel fahren mit unseren Bildern von Füßen eben.

00:42:11: Wodurch die Frage stellen die allen Leuten ist das sicherlich auf der Zunge brennt waren das dann Füße von Kolleginnen und Kollegen hier aus dem Unternehmen oder habt ihr hier fremd Füße zur Verfügung gestellt bekommen.

00:42:25: Fremd Füße okay mehr frage ich an der Stelle auch nicht nach.

00:42:28: War noch gar nicht wir sonst findet er es gemacht hat.

00:42:31: Okay okay.

00:42:32: Und das war eine schöne Aktion die sind in jedem mannheim-innenstadt gegangen haben da Leute gefragt ob die Füße fotografieren dürfen und haben dann für die fotografierten Füße Bäume gepflanzt.

00:42:43: Okay das ist aber wirklich.

00:42:45: Also wenn du es sagen kannst Fuß gegen Baum also Foto vom Fuß gegen Baum guter Deal er sehr spannend geht so vielleicht ein anderes Projekt aus dem Bereich Computer wischen wo du was zu tun hattest wo du vielleicht noch was erzählen kannst.

00:42:59: Ganz Bundes Thema ist Bilder suchen passieren aufgegangen oder inhaltsbasierte Bildersuche.

00:43:06: Mnt wie bei der Google Bildersuche zu haben wir auch das Servicemeister Forschungsprojekt zur hat man einen Teil,

00:43:16: Anleitungen von Maschinen und in diesen Anleitung von den Maschinen sind ganz viele Bilder drin.

00:43:22: Und jetzt habe ich z.b. eine Maschine und ich weiß nicht genau was für eine Maschinen das ist und ich mache jetzt ein Foto von dieser Maschine.

00:43:30: Und das finde ich mir die anderen dazu allein basierend auf dem Foto.

00:43:33: Okay aber das ist aber richtig cool.

00:43:37: Und das funktioniert eben auch wird das was ihn schon erzählt hatten oder drüber geredet hatten dass wir eben das Bild nehmen in eine andere Repräsentation überführen und dann die ähnlichsten Bilder finden in diesem,

00:43:51: kannst du mir nachher eben irgendwie Semantik codiert.

00:43:57: Ja das ist aber echt Spandl also wenn ich mir das vorstelle ich habe irgendwie meine App auf dem Handy und ich muss jetzt an dieser rießen Recycling Sortiermaschine oder was weiß ich was Maschine irgendwas einstellen

00:44:10: und ich mache nur ein Foto davon und mir wird angezeigt schau mal die drei Anleitung könnten passen gleich dir doch bitte mal noch kurz ab dass wir als Menschen super easy hin kann ich mir kurz drauf schauen aber allein schon diese,

00:44:21: diese Einschränkungen zu bekommen sein okay sie nicht diese 10000 sondern sind wenn echt nur drei Stück das war echt eine tolle Hilfe schon.

00:44:28: Und mit mir kann man eben unglaublich viele Sachen machen also man kann es nicht noch in Katalogen suchen man könnte z.b. auch sagen ich habe hier ich habe einen Onlineshop und ich habe eben Polier dir gut gefällt,

00:44:42: der ist gerade kaputt finde mir mal Pullis die ähnlich aussehen kann ich einfach ein Bild von ihrem Pulli machen und dann würden wir die Pullis gefunden Ehehalt.

00:44:53: Ja oder Eltern den Kind haben das Kind hat irgend so ein Plüschtier und kann ohne das Budget nicht schlafen und man vergisst oder verliert irgendwo und muss sich dann bis jetzt muss man sich mühsam irgendwie durch Social Media durch,

00:45:04: tackern und fragen ob irgendjemand diesen Plüschhasen kennt aber mit so einer App kann ich ihn einfach fotografieren und er wird direkt angezeigt wo ich den bestellen kann.

00:45:16: Matthias am vielleicht können wir am Schluss noch mal den Bogen zum Anfang schlagen da haben wir ja drüber gesprochen dass das Sehen für uns so ein super wichtiges Sinnes und deswegen auch die Computer wischen so wichtig ist weil sie uns viel,

00:45:30: erleichtern könnte wenn Sie uns hier unterstützt als Menschen und da habe ich die Frage gestellt ob das nicht auch Menschen irgendwie helfen könnte die blind sind oder,

00:45:40: die halt schlecht sehen ich glaube vielen Anfang sind blinde Menschen sind ja auch nicht zu 100% blind sondern vielleicht nur zu 95% blind und sehen andere noch eine Farbe oder hell oder dunkel,

00:45:51: aber mit denen mit den ganzen Leuten die halt so Sehbeeinträchtigungen haben,

00:45:57: gibt's da aktuell Ansätze wie man denen helfen kann durch den welche Assistenzsysteme.

00:46:03: Ja da gibt's noch iPhone ansetzen dass ich dich ist auch der Lehrstuhl an dem ich die Studien Diplomarbeit geschrieben habe die haben auch mit,

00:46:11: ja unbedingt Menschen zusammen gearbeitet also z.b. das war nicht total abgefahren das gibt so ein Ding das ist da,

00:46:24: Aktuator die nächsten York die Zunge.

00:46:28: Und verbindest du mit einer Kamera und dann gibt er die Signale auf deiner Zunge wo was zu sehen ist und dadurch kannst du so ein bisschen sehen.

00:46:36: Es gibt andere Sachen die versuchen zu erkennen auf dem Weg wo ist der Bordstein damit du nicht runter läufst.

00:46:44: Verschiedene Techniken das Problem ist nur dass das oft an den blinden Menschen vorbei gemacht wird.

00:46:52: Falls die Satzungen soll ist halt toll wenn du dann dadurch ein bisschen sehen kannst und du kannst plötzlich nie mehr sprechen,

00:46:58: die anderen Verfahren die Bordstein erkennen und so weiter warum sind die besser als als ein Stock mit dem die Leute umgehen können den die richtig gut bedienen kann der super gut funktioniert,

00:47:11: allgemein Werkstatt aufpassen was tatsächlich aber hilfreich ist,

00:47:18: ich habe ich auch schon kurz angesprochen war ein beutellos dort von Studenten gemacht worden ist zu erkennen wo ist der Knopf auf den ich drücken muss um die Straßenbahn reinzukommen.

00:47:28: Solche Kleinigkeiten einfach oder zu erkennen guck die Person mich gerade an mit der ich rede.

00:47:37: Gleich LTE oder auch nicht böse an solche Sachen sind Sachen die vielleicht helfen können aber.

00:47:43: Wie gesagt es ist auch dass man dabei und denkst ihm die ganzen Sachen ausgeben wir den Menschen helfen können vergiss die aber zu fragen was den tatsächlich hilft.

00:47:52: Ja ich glaube das ist halt ein generelles Problem wenn man versucht Lösungen zu entwickeln für Personen,

00:47:59: oder für den Personenkreis der halt nicht der eigene Personenkreis ist ich glaube wenn man die Leute nicht fragt oder nicht involviert man fragen ist vielleicht einfach zu wenig,

00:48:09: dann wird es auch sehr schwierig irgendwelche Lösung zu finden weil ich weiß dass du das ansprichst mit dem Sensor auf der Zunge.

00:48:16: Also ich glaube es war als als Informatiker oder ist Ihnen schon eher würde ich jetzt erstmal sagen ja total coole Sache hey aber ich muss es ja nicht benutzen,

00:48:27: ich bringe da immer so gern zum Beispiel kennst du öffentliche Gebäude wo man dann irgendwie so eine Treppe hoch gehen muss um 2 eingang zu kommen,

00:48:36: das ist ganz oft so dass solche Treppenstufen nicht fürs gehen gemacht sind weil die immer so kleine Stückchen zu weit auseinander sind oder zu wenig auseinander sind dass man keine richtige Schritte gehen kann.

00:48:47: Ich bin kein Architekt aber ich frage mich oft ob die Architekten die das entwerfen,

00:48:52: da auch überlegen ob man darauf gehen kann oder ob sie das einfach nur entwerfen weil es schön aussieht oder vielleicht sie meine Beine auch zu lang oder zu kurz das weiß ich nicht.

00:49:00: Oh das ist noch schlimmer und ist genormt.

00:49:02: Stimmt es in Deutschland dass es wurde genormt aber in den 1950 er Jahren und da waren die Beine vielleicht doch im Durchschnitt Kürzel vom Durchschnittsmann allerdings,

00:49:14: ja dass das kann auch sein also das ist schon so eine Sache ich glaube,

00:49:20: man man tut sich was Gutes wenn man die Leute halt mitten im Trend zum Forschungszentrum Forschungsbereiche Ring.

00:49:27: Man keine Ahnung was am Schluss steht irgendwann vielleicht haben wir es ja wie bei Star Trek beim Geordi LaForge dass man wirklich auch so Implantate,

00:49:35: Leuten einsetzen kann mit denen sie vielleicht teilweise wieder sehen können ich glaube da gab es ja auch schon so Forschungen und Experimente,

00:49:43: Dimension Sensoren irgendwie implantiert hat oder welche Elektroden implantiert hat mit den sie dann wieder mich Sinneseindrücke verarbeiten kann.

00:49:53: Trotzdem würde ich sie fragen ob sie sich über Polen also ich weiß z.b. bei gehörlosen Menschen dass die dass da Leute gibt die gar nicht wollen dass die in der Rasen wieder bewerten wird.

00:50:04: Weil sicher auch nein Kultur und wickelt hat überall die Gebärdensprache und das wurde dann ja wieder genommen.

00:50:10: Erzählt also diese Freiwilligkeit die ist natürlich super wichtig und na ja das hat es bei euch nicht so viel mit Computerwissen zu tun aber die Ethik ist natürlich auch super super wichtig denn,

00:50:22: ich weiß den Namen nicht mehr aber ich verstehe das und ich packe mal den Link in die shoutouts rein,

00:50:28: Vattenfall in den USA wo ein Startup so so ein System entwickelt hat mit dem blinde Menschen es nicht wieder sehen konnte.

00:50:38: Aber über eine Elektrode die glaube ich ins Gehirn verpflanzt wurde halt irgendwelche Informationen aus der Kamera irgendwie mit mitnehmen konnten und,

00:50:47: dann zumindest ein bisschen mehr bisschen mehr Lebensqualität hatten indem in dem Hinblick,

00:50:54: diese Firma ist durch Konkurs gegangen oder so und es gab aber keine keine Pläne wie man das Weiterführen kann und dann wurde der Menschen das wieder weggenommen.

00:51:03: Und die ja das ist echt mies einfach das ist eine schlimme Sachen ich glaube wenn man solche Dinge tut dann braucht man da wahrscheinlich auch,

00:51:12: welche ethischen Grundlagen oder Richtlinien und vielleicht auch irgendwie eine Staatsbürgerschaft dass man,

00:51:18: wenn ich mir irgendeine Sensor oder unter Elektrode verpflanzen lasse das auch garantiert ist dass der Staat dann einspringt für mich,

00:51:26: wenn es daran kaut geht weil bei uns da dabei ist es ja nie ob du es in 10 Jahren noch da ist oder nicht Matthias,

00:51:35: was ist das für deine persönliche Perspektive oder dein persönlicher Ausblick für die Zukunft im Bereich Computerwissen was für das dieses Jahr erwarten glaubst du dass es vielleicht irgendwo noch ein richtig spannenden durchbruchgeber eine kleine Revolution.

00:51:49: Es gibt zwei spannende Themen für eins ist was schon was ein bisschen länger da ist und sich so verfestigt das sind die nerfs oder ernährst ihn Jura Radiance Filz oder einfach nur newfields.

00:52:05: Dass die Idee dass man Felder repräsentiert Felder essen.

00:52:12: Ist was auf der Physik ist einfach ich habe einen Raum und an jedem Punkt in diesem Raum habe ich Werte.

00:52:21: Und die Idee mit diesen North ist das diese Werte die ich an den Punkt dran setze dichte sind und Farbe,

00:52:30: und was ich dann damit machen kann ist dass ich eine Sehne in einem Raum oder in der 3D repräsentiere,

00:52:37: indem ich sage ok ich habe jetzt hier eine Szene von einer Tasse.

00:52:43: Und fast alles in dieser Szene hat dich denn nur nur dort wo die Tasse ist ist die Dichte größer als 0 und ist die Farbe Grün.

00:52:56: Diesel,

00:52:57: diese Felder kann ich dann nehmen um daraus wieder Bilder zu generieren aus Ansichten die neu sind also ich kann einen Kamera um diese Tasse umziehen und dann ein 3D oder ein ein 2D Bild drauf zu rennen,

00:53:10: was ist eine 3D Repräsentation von Objekten.

00:53:19: Genau der Funktion hat eben Bilder aus verschiedenen Positionen und mach dann eigentlich ein relativ simples deep learning Modell was eben dann diese Feld Repräsentationen.

00:53:35: Goutiert.

00:53:38: Da passiert relativ ihr es gibt das spannende gerade so Produkte mit denen man z.b. jetzt auch so sein sein Haus vermessen kann durch die Gänge laufen kann und dann wird daraus ein Nerf Modell gebaut.

00:53:52: Haben was man dann virtuell wieder durchlaufen kann.

00:53:58: Technisch bitte passiert da relativ viel dass man also typischerweise ist es so dass man da mit diesen Nerv dafür sorgen muss dass ich direkte nicht viel ändern während ich Bilder aufnehmen was zu überführen Menschen schwierig es waren die Tendenz sich zu bewegen.

00:54:12: Hashtags Zappelphilipp.

00:54:15: Und da geht's eben auch technische Verfahren dass man mit gewissen Doppeldeutigkeiten geht durch entstehen umgehen kann und da eben auch in 3D Modellen konstantes 3D Modell wieder zu zurück konstruieren.

00:54:27: Aber für diese Modelle brauche ich nur eine normale Kameratechnologie kein Radar kein Laserscanner.

00:54:36: Einfach eine ganz normale Kamera die ganz normale Bilder macht also ein Handy Kamera heute aus und daneben viele Bilder aus verschiedenen Positionen und mit diesem Nerf kann ich dann Bilder generieren die aus einer anderen Position kommen die nicht dich nicht aufgenommen habe.

00:54:50: Das heißt wenn ich jetzt beispielsweise durch wir wissen es hier gerade in Karlsruhe,

00:54:55: wenn ich durch Karlsruhe durch fahre und da viele Fotos mache könnte ich mir ein 3D Modell von dieser Stadt generieren und dass beispielsweise im Computerspiel nutzen.

00:55:05: Wenn du sehr sehr viele Fotos hast und einen sehr sehr großen Computer dann müsste das gerne.

00:55:11: Ja also mein Computer der steht ist hier auf dem Tisch der ist leider relativ klein also ich glaube da bin ich schon mal raus,

00:55:17: aber sowas ok eine ganze Stadt ist und ich was riesengroßes aber du bist gerade schon Gebäude angesprochen da kann man sowas machen das cool eigentlich,

00:55:26: historische Gebäude Pflaster sehr spannend ich bin jetzt hier in Deutschland und ich möchte erstmal irgendwie nen historisches Gebäude anschauen weil in wie,

00:55:32: alcatrazz oder so und ich muss nicht hin fliegen nach San Francisco sondern dass ein Team vor Ort dort das fotografiert alles,

00:55:41: nimmt dann sehr sehr großen Computer für eine gewisse Zeit und ich kann mir das 3D Modell dann anschauen.

00:55:48: Oder du kannst dir das zu Hause ausdrucken auf den Tisch stellen.

00:55:52: Mit dem 3D Drucker und das war ja so die Überleitung zu dem an dem großen Thema was ich sehe ist dass das Thema Computer würden verschmilzt mit anderen Bereichen einerseits die das naturlänge processing,

00:56:05: das darf erfahren wo du Besuch schon immer Verfahren genutzt hier aus dem netto Länge Sprüche Essen kommen oder wo noch Computerviren übertragen,

00:56:13: passt jedoch weiterhin so also gerade die Transformer die ja erst aus dem Text bearbeiten kann gibt's jetzt als bisschen Transformer für die Bildverarbeitung,

00:56:22: aber auch mit dieser jungen generated by Geschichten dass ich jetzt einen einen Text prompt vorhin kann ist er ein Bilder generiert die dazu passen,

00:56:31: das ist ein interessanter Fachmessen jeder passiert das ist ja Einrichtung und die andere stimmt die Verschmelzung von Computer wischen und Computergrafik,

00:56:39: aufzumachen wieder an dieser neue TV was ich eigentlich mache es mir Bilder generieren was typischerweise Computergrafik gemacht hat.

00:56:47: Und wenn hier aber Techniken genutzt die aus der Computerwissen kommen Und,

00:56:54: ja das ist eine ganz interessante Tendenzen nicht dass du alles wieder zusammen läuft das früher mal auseinander gelaufen ist.

00:57:01: Aber ich finde gerade was wir noch angesprochen hast das Thema generate FIFA das finde ich so spannend dass du es ja aktuell auch

00:57:08: wirklich auch in den Mainstream-Medien und so keine Ahnung beim Spiegel oder so gibt's da wenn die Artikel drüber dass man jetzt mit drei Modellen oder Verfahren sich jetzt Bilder von Angela Merkel generiert die Kacke am Angelausflug ist

00:57:22: und das ist dann fast schöne Titelseite,

00:57:26: Matthias ich wollte sagen dass wir uns vielleicht mal in paar Monaten noch mal zusammensetzen und du mir dann vielleicht endlich mal erklärst wie das genau funktioniert.

00:57:36: Sehr schön matthias da freue ich mich drauf und für heute soll ich danke das war ein sehr interessanter Einblick in den Bereich Computer wischen,

00:57:44: und ich würde aufmerksamer sein wenn ich das nächste mal in die oa code scanner oder in der Supermarkt bin und beobachte wie ein Barcode gescannt.

00:57:53: Danke schön der ist bis bald tschüss.

00:57:57: Das war das Gespräch mit Mathias ich hoffe es hat euch Spaß gemacht wenn Ihr Feedback habt dann erreichte mich per E-Mail unter Podcast at inovex punkt de wir hören uns in zwei Wochen wieder bis dahin wünsche ich euch viel Spaß und eine gute Zeit.

00:58:10: Intro

Neuer Kommentar

Dein Name oder Pseudonym (wird öffentlich angezeigt)
Mindestens 10 Zeichen
Durch das Abschicken des Formulars stimmst du zu, dass der Wert unter "Name oder Pseudonym" gespeichert wird und öffentlich angezeigt werden kann. Wir speichern keine IP-Adressen oder andere personenbezogene Daten. Die Nutzung deines echten Namens ist freiwillig.