Jump to content

Die OM System Community

Empfohlene Beiträge

vor 11 Stunden schrieb systemcam-neu:

Hat irgend jemand behauptet eine herkömmliche Suchmaschine funktioniert wie ein neuronales Netz oder hätte dessen Fähigkeiten?

Ja aber wie kommst du darauf das eine herkömmliche Suchmaschine genauso wie ein KI Modell arbeiten soll?  

Am 13.1.2025 um 20:01 schrieb systemcam-neu:

Im Prinzip es es auch nichts anderes als eine Wissensdatenbank. Nur das diese eben nicht wie eine Suchmaschine 1:1 Textkopien von den gespeicherten Daten zurückliefert sondern die Inhalte in abstrakter Form mit inhaltlichen Zusammenhängen ausgeben kann die durch die Analyse und das Training des Modells in Form von "Gewichten" generiert wurden.   

Ich habe dich so verstanden, dass du der Ansicht bist, KI sei im Prinzip nichts anderes als eine Wissensdatenbank, die im Vergleich/Unterschied zu einer Suchmaschine die Inhalte in abstrakter Form speichert und ausgibt. Meiner Meinung nach ist dieser Vergleich nicht korrekt.

vor 11 Stunden schrieb systemcam-neu:

Um eine KI überhaupt trainieren zu können ist aber der Inhalt einer Suchmaschine erforderlich.

Das ist nicht ganz richtig, denn Suchmaschinen sind im Prinzip lediglich riesige, indexierte Inhaltsverzeichnisse. Streng genommen besteht der Inhalt einer Suchmaschinen-Datenbank hauptsächlich aus Informationen darüber, wo welche Inhalte im Internet zu finden sind. In der Praxis speichern Suchmaschinen zwar deutlich mehr in ihren Datenbanken, aber das gesamte Internet ist nicht in einer Suchmaschine gespeichert. Stattdessen wird nur ein Ausschnitt der verfügbaren Inhalte indiziert, um sie durchsuchbar zu machen.

Das Internet ist jedoch ohnehin nicht die einzige Quelle, die für das Training von KI-Modellen verwendet wird. Hinzu kommen weitere umfangreiche Ressourcen wie Bücher, wissenschaftliche Artikel und andere Publikationen etc. Außerdem gewinnen synthetisch generierte Daten zunehmend an Bedeutung, da inzwischen angenommen wird, dass das gesamte verfügbare Wissen bereits für das Training der großen Modelle genutzt wurde.
 

vor 11 Stunden schrieb systemcam-neu:

Bei einfachen Modellen mag man evtl. den Content noch selber produzieren können. Bei dem was man heute im großen Stiel macht greift man auf den riesigen Content den Internets zurück wo das in großen Mengen schon vorliegt.  Und es ist dann auch so wie Andreas sagt, das dann Gemeinsamkeiten von Strukturen in Bildern gelernt werden egal was das jetzt genau ist. Da kann auch viel schief gehen wenn man nicht aufpasst. Es gab bspw. auch schon Systeme die Röntgenbilder analysiert haben um darin entsprechende Befunde zu erkennen. Im Prinzip funktioniert das auch aber da wurde auch mal später festgestellt das das System z.T. deswegen Fehler macht weil auf den Bildern die Unterschriften von bestimmten Ärzten zu sehen waren und das System dann auch diese Unterschriften gelernt hatte.

Wie ich bereits erwähnt habe, sind die Merkmale und Muster, die eine KI während des Trainings erkennt, nicht vorgegeben. Stattdessen „entscheidet“ die KI basierend auf den Trainingsdaten selbst, welche Merkmale und Muster in den Daten relevant sind, und erstellt daraus eine entsprechende numerische Repräsentation.
Daraus ergibt sich zwangsläufig, dass die KI  zu einer – aus unserer Sicht – falschen Klassifizierung der Ergebnisse kommen kann, wenn sie mit ungeeigneten Trainingsdaten trainiert wurde. Die Qualität und Vielfalt der Trainingsdaten spielen daher selbstverständlich eine entscheidende Rolle für die Zuverlässigkeit und Genauigkeit der Ergebnisse. 
 

bearbeitet von photojack
Link zu diesem Kommentar
https://www.oly-forum.com/topic/39676-ki-bildbesprechung/page/2/#findComment-631089
Auf anderen Seiten teilen

vor 8 Stunden schrieb photojack:

Ich habe dich so verstanden, dass du der Ansicht bist, KI sei im Prinzip nichts anderes als eine Wissensdatenbank, die im Vergleich/Unterschied zu einer Suchmaschine die Inhalte in abstrakter Form speichert und ausgibt. Meiner Meinung nach ist dieser Vergleich nicht korrekt.

Es ist eine andere höhere Form davon die durch aufwendiges Training um Zusammenhänge erweitert wurde. Auf jeden Fall ist das Trainingsmaterial darin enthalten, man könnte es dort auch wieder herausholen und zusätzlich kann sie über die gelernten Zusammenhänge natürlich auch völlig neue Sachen generieren.

vor 8 Stunden schrieb photojack:

Das ist nicht ganz richtig, denn Suchmaschinen sind im Prinzip lediglich riesige, indexierte Inhaltsverzeichnisse. Streng genommen besteht der Inhalt einer Suchmaschinen-Datenbank hauptsächlich aus Informationen darüber, wo welche Inhalte im Internet zu finden sind. In der Praxis speichern Suchmaschinen zwar deutlich mehr in ihren Datenbanken, aber das gesamte Internet ist nicht in einer Suchmaschine gespeichert. Stattdessen wird nur ein Ausschnitt der verfügbaren Inhalte indiziert, um sie durchsuchbar zu machen.

Das Internet ist jedoch ohnehin nicht die einzige Quelle, die für das Training von KI-Modellen verwendet wird. Hinzu kommen weitere umfangreiche Ressourcen wie Bücher, wissenschaftliche Artikel und andere Publikationen etc. Außerdem gewinnen synthetisch generierte Daten zunehmend an Bedeutung, da inzwischen angenommen wird, dass das gesamte verfügbare Wissen bereits für das Training der großen Modelle genutzt wurde.

Nun ja irgend eine Quelle braucht man. Und sie muss digital sein was Bücher nicht sind wenn sie nicht digital vorliegen. Im Internet gibt es aber auch recht viele digitalisierte Bücher. Und dann sind viele Sachen im Internet frei verfügbar was ebenfalls ein großer Faktor ist das eben genau das Internet mit Abstand die größte Quelle ist.

vor 8 Stunden schrieb photojack:

Wie ich bereits erwähnt habe, sind die Merkmale und Muster, die eine KI während des Trainings erkennt, nicht vorgegeben. Stattdessen „entscheidet“ die KI basierend auf den Trainingsdaten selbst, welche Merkmale und Muster in den Daten relevant sind, und erstellt daraus eine entsprechende numerische Repräsentation.
Daraus ergibt sich zwangsläufig, dass die KI  zu einer – aus unserer Sicht – falschen Klassifizierung der Ergebnisse kommen kann, wenn sie mit ungeeigneten Trainingsdaten trainiert wurde. Die Qualität und Vielfalt der Trainingsdaten spielen daher selbstverständlich eine entscheidende Rolle für die Zuverlässigkeit und Genauigkeit der Ergebnisse.

Ja, allerdings kann man sich bei den sehr großen Sprach Modellen und deren gigantischen Datenmengen die z.T. in die Billionen geht eine manuelle Sichtung oder gar Qualitätskontrolle überhaupt nicht leisten. In so fern gibt es dadurch ein nicht vorhersehbares Fehlerpotential. Und die Tatsache das durch die Verbreitung von KI das Internet immer mehr mit minderwertigen und z.T. fehlerhaften KI generierten Inhalten geflutet wird führt langfristig zwangsläufig auch dazu das das Trainingsmaterial immer schlechter wird was dann auch die KI Modelle wieder schlechter werden lässt.

 

bearbeitet von systemcam-neu
Link zu diesem Kommentar
https://www.oly-forum.com/topic/39676-ki-bildbesprechung/page/2/#findComment-631177
Auf anderen Seiten teilen

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.
Note: Your post will require moderator approval before it will be visible.

Gast
Auf dieses Thema antworten...

×   Du hast formatierten Text eingefügt.   Formatierung jetzt entfernen

  Only 75 emoji are allowed.

×   Dein Link wurde automatisch eingebettet.   Einbetten rückgängig machen und als Link darstellen

×   Dein vorheriger Inhalt wurde wiederhergestellt.   Clear editor

×   Du kannst Bilder nicht direkt einfügen. Lade Bilder hoch oder lade sie von einer URL.

  • Wer ist Online   0 Benutzer

    • Keine registrierten Benutzer online.
×
×
  • Neu erstellen...

Wichtige Information

Wenn Sie diese Seite nutzen, stimmen Sie den Community-Regeln zu. Wir haben Cookies gesetzt, um die Bedienung des Forums zu verbessern. Du kannst deine Cookie-Einstellungen anpassen, andernfalls gehen wir davon aus, dass du damit einverstanden bist. Mehr Informationen in unserer Datenschutzerklärung