Muster kundigung

Die Bedeutung von Vorkenntnissen im maschinellen Lernen wird durch ihre Rolle bei der Suche und Optimierung suggeriert. Locker heißt es im No Free Lunch Theorem, dass alle Suchalgorithmen die gleiche durchschnittliche Leistung über alle Probleme haben, und impliziert daher, dass man, um die Leistung auf einer bestimmten Anwendung zu gewinnen, einen spezialisierten Algorithmus verwenden muss, der einige Vorkenntnisse über das Problem enthält. Eine andere Art von Klasseninvarianz, die in der Mustererkennung gefunden wird, ist die Permutationsinvarianz, d. h. die Invarianz der Klasse in eine Permutation von Elementen in einer strukturierten Eingabe. Eine typische Anwendung dieser Art von Vorkenntnissen ist eine Klassifier-Invariante für Permutationen von Zeilen der Matrix-Eingänge. In dieser Studie gelang es P2K, drei Komponenten zu integrieren, die für die Analyse und Vorhersage von R2R-I zwischen zwei Proteinsequenzen wichtig sind. Es verwendet: (a) prägnantere und präzisere statistische Messgrößen, um Daten zu analysieren; b) entwirrte statistische Maßnahmen zur Aufpreisung und Gewinnung spezifischerer tiefer Kenntnisse; und (c) tiefes Wissen, das für den Bau von FVs für den Bau von R2R-I-Prädiktoren entdeckt wurde. Daher öffnet P2K ein neues Kapitel in der sequenzbasierten R2R-I-Vorhersage nur mit Sequenzdaten und erfordert keine externe Kenntnis der Sequenzen. Es lieferte eine deutlich höhere Leistung als ein zufälliger Prädiktor sowie eine vorhandene Softwareplattform, die auf Feature-Engineering auf externem Wissen über Sequenzen basiert. Es gibt einen vielversprechenden neuen Weg, um die R2R-I-Vorhersage weiter zu verbessern.

Dies ist das erste Mal, dass das erklärbare Tiefe wissen aus Daten entdeckt wird, um ML zu verbessern. P2K verwendete einen ausgewählten Satz entwirrter statistischer Vektorräume, anstatt zeitaufwändige Feature-Engineerings wie in der aktuellen ML durchzuführen. Da das entdeckte tiefe Wissen erklärbar ist, stellt es eine Pionierarbeit in der tiefen Wissensentdeckung und erklärbaren KI dar. Wir validierten zuerst die R2R-I-Vorhersageergebnisse von P2K über die ersten 124 PPI-Komplexe in DBD 4.019 unter Leave-one-complex-out-alone-Cross-Validierung (Details siehe Ergänzungshinweis 4). Wie in der Ergänzungstabelle 4.3 dargestellt, hat P2K einen höheren durchschnittlichen AUC (0,69078 x 0,02757) erreicht als der eines Zufallsprädiktors (0,50000 x 0,00000). Selbst wenn kein benachbarter Rückstand berücksichtigt wird, ist der durchschnittliche AUC (0,59600 x 0,01531) immer noch viel höher als der eines Zufallsvorhersagers. Dies deutet stark darauf hin, dass das tiefe Wissen, das aus R2R-C-Daten entdeckt wurde, für die R2R-I-Vorhersage wirksam ist. Unsere nächste Frage lautet: “Könnte das entdeckte tiefe Wissen verwendet werden, um die R2R-I-Vorhersage zu verbessern?” Als Reaktion darauf entwickelten wir eine Methode, die als Deep Knowledge-Directed ML (oder P2K) für R2R-I Prediction bekannt ist.