Haupt Andere Rate falscher Entdeckungen

Rate falscher Entdeckungen

Überblick

Software

Beschreibung

Webseiten

Lesungen

Kurse

Ebenen der Krankheitsprävention

Überblick

Diese Seite beschreibt kurz die False Discovery Rate (FDR) und bietet eine kommentierte Ressourcenliste.

Beschreibung

Bei der Analyse von Ergebnissen genomweiter Studien werden oft Tausende von Hypothesentests gleichzeitig durchgeführt. Die Verwendung der traditionellen Bonferroni-Methode zur Korrektur von Mehrfachvergleichen ist zu konservativ, da der Schutz vor dem Auftreten falsch positiver Ergebnisse zu vielen übersehenen Ergebnissen führt. Um möglichst viele signifikante Vergleiche identifizieren zu können und dennoch eine niedrige False-Positive-Rate beizubehalten, werden die False Discovery Rate (FDR) und ihr Analogon der q-Wert verwendet.

Definition des Problems
Wenn wir Hypothesentests durchführen, um beispielsweise zu sehen, ob zwei Mittelwerte signifikant unterschiedlich sind, berechnen wir einen p-Wert, der die Wahrscheinlichkeit ist, eine Teststatistik zu erhalten, die genauso oder extremer ist als die beobachtete, vorausgesetzt, die Nullhypothese ist wahr. Wenn wir beispielsweise einen p-Wert von 0,03 hätten, würde dies bedeuten, dass, wenn unsere Nullhypothese wahr ist, eine Chance von 3% besteht, unsere beobachtete Teststatistik oder eine extremere zu erhalten. Da dies eine kleine Wahrscheinlichkeit ist, verwerfen wir die Nullhypothese und sagen, dass die Mittelwerte signifikant unterschiedlich sind. Normalerweise möchten wir diese Wahrscheinlichkeit unter 5% halten. Wenn wir unser Alpha auf 0,05 setzen, sagen wir, dass die Wahrscheinlichkeit, dass ein Null-Ergebnis als signifikant bezeichnet wird, kleiner als 5 % sein soll. Mit anderen Worten, wir möchten, dass die Wahrscheinlichkeit eines Fehlers vom Typ I oder eines falsch positiven Ergebnisses weniger als 5 % beträgt.

Wenn wir mehrere Vergleiche durchführen (ich nenne jeden Test ein Merkmal), haben wir eine erhöhte Wahrscheinlichkeit falsch positiver Ergebnisse. Je mehr Features Sie haben, desto höher ist die Wahrscheinlichkeit, dass ein Null-Feature als signifikant bezeichnet wird. Die False-Positive-Rate (FPR) oder Per Vergleichsfehlerrate (PCER) ist die erwartete Anzahl von False-Positives aus allen durchgeführten Hypothesentests. Wenn wir also den FPR bei einem Alpha von 0,05 kontrollieren, garantieren wir, dass der Prozentsatz der falsch positiven Ergebnisse (Nullmerkmale, die als signifikant bezeichnet werden) aller Hypothesentests 5 % oder weniger beträgt. Diese Methode wirft ein Problem auf, wenn wir eine große Anzahl von Hypothesentests durchführen. Wenn wir beispielsweise eine genomweite Studie zur Untersuchung der unterschiedlichen Genexpression zwischen Tumorgewebe und gesundem Gewebe durchführen und 1000 Gene testen und die FPR kontrollieren, werden im Durchschnitt 50 wirklich Null-Gene als signifikant bezeichnet. Diese Methode ist zu großzügig, da wir nicht so viele Fehlalarme haben wollen.

Typischerweise kontrollieren mehrere Vergleichsverfahren stattdessen die familienweise Fehlerrate (FWER), die die Wahrscheinlichkeit ist, bei allen durchgeführten Hypothesentests ein oder mehrere falsch positive Ergebnisse zu haben. Die häufig verwendete Bonferroni-Korrektur steuert die FWER. Wenn wir jede Hypothese auf einem Signifikanzniveau von (Alpha/Anzahl der Hypothesentests) testen, garantieren wir, dass die Wahrscheinlichkeit, ein oder mehrere Fehlalarme zu haben, kleiner als Alpha ist. Wenn also Alpha 0,05 wäre und wir unsere 1000 Gene testen würden, würden wir jeden p-Wert auf einem Signifikanzniveau von 0,00005 testen, um zu garantieren, dass die Wahrscheinlichkeit eines oder mehrerer falsch positiver Ergebnisse 5 % oder weniger beträgt. Der Schutz vor einem einzelnen falsch positiven Ergebnis kann jedoch für genomweite Studien zu streng sein und zu vielen verpassten Ergebnissen führen, insbesondere wenn wir erwarten, dass es viele echte positive Ergebnisse gibt.

Die Kontrolle der False Discovery Rate (FDR) ist eine Möglichkeit, so viele signifikante Merkmale wie möglich zu identifizieren und gleichzeitig einen relativ geringen Anteil an False Positives zu erhalten.

Schritte zur Kontrolle der Falscherkennungsrate:

  • Kontrolle für FDR auf Stufe α *(d. h. die erwartete Menge an falschen Entdeckungen geteilt durch die Gesamtzahl der Entdeckungen wird kontrolliert)

E [V⁄R]

  • Berechnen Sie p-Werte für jeden Hypothesentest und jede Hypothese (vom kleinsten zum größten, P(min)…….P(max))

  • Prüfen Sie für den i-ten geordneten p-Wert, ob Folgendes erfüllt ist:

P (i) ≤ α × i / m

Wenn wahr, dann signifikant

*Einschränkung: Wenn die Fehlerrate (α) sehr groß ist, kann dies zu einer erhöhten Anzahl von falsch positiven Ergebnissen bei signifikanten Ergebnissen führen

Die False Discovery Rate (FDR)

Die FDR ist die Rate, mit der als signifikant bezeichnete Merkmale wirklich null sind.
FDR = erwartet (# falsche Vorhersagen/# Gesamtvorhersagen)

Die FDR ist die Rate, mit der als signifikant bezeichnete Merkmale wirklich null sind. Ein FDR von 5 % bedeutet, dass von allen als signifikant bezeichneten Merkmalen 5 % davon wirklich null sind. So wie wir Alpha als Schwellenwert für den p-Wert festlegen, um den FPR zu steuern, können wir auch einen Schwellenwert für den q-Wert festlegen, der das FDR-Analogon des p-Werts ist. Ein p-Wert-Schwellenwert (Alpha) von 0,05 ergibt eine FPR von 5 % unter allen wirklich Null-Features. Ein q-Wert-Schwellenwert von 0,05 ergibt eine FDR von 5 % unter allen als signifikant bezeichneten Merkmalen. Der q-Wert ist der erwartete Anteil falsch positiver Ergebnisse unter allen Merkmalen, die extremer oder extremer sind als die beobachteten.

In unserer Studie mit 1000 Genen, sagen wir, Gen Y hatte einen p-Wert von 0,00005 und einen q-Wert von 0,03. Die Wahrscheinlichkeit, dass eine Teststatistik eines nicht-differenziell exprimierten Gens genauso oder extremer wäre wie die Teststatistik für Gen Y, beträgt 0,00005. Die Teststatistik von Gen Y kann jedoch sehr extrem sein, und möglicherweise ist diese Teststatistik für ein unterschiedlich exprimiertes Gen unwahrscheinlich. Es ist durchaus möglich, dass es tatsächlich differentiell exprimierte Gene mit weniger extremen Teststatistiken als das Gen Y gibt. Mit dem q-Wert von 0,03 können wir sagen, dass 3% der Gene als extremer oder extremer (dh die Gene mit niedrigerem p- Werte), da das Gen Y falsch positiv ist. Die Verwendung von q-Werten ermöglicht es uns zu entscheiden, wie viele Fehlalarme wir unter allen Merkmalen, die wir als signifikant bezeichnen, akzeptieren möchten. Dies ist besonders nützlich, wenn wir eine große Anzahl von Entdeckungen für eine spätere weitere Bestätigung machen möchten (z. Dies ist auch in genomweiten Studien nützlich, bei denen wir erwarten, dass ein beträchtlicher Teil der Merkmale wirklich alternativ ist, und wir unsere Entdeckungskapazität nicht einschränken möchten.

Der FDR hat einige nützliche Eigenschaften. Wenn alle Nullhypothesen wahr sind (es gibt keine wirklich alternativen Ergebnisse), ist FDR=FWER. Wenn es eine Anzahl von wirklich alternativen Hypothesen gibt, steuert die Kontrolle für den FWER automatisch auch den FDR.

Die Power der FDR-Methode (erinnern Sie sich, dass die Power die Wahrscheinlichkeit ist, die Nullhypothese abzulehnen, wenn die Alternative wahr ist) ist gleichmäßig größer als die Bonferroni-Methode. Der Machtvorteil des FDR gegenüber den Bonferroni-Methoden nimmt mit zunehmender Anzahl von Hypothesentests zu.

Schätzung des FDR
(Aus Storey und Tibshirani, 2003)

Definitionen:t: SchwellenwertV: Anzahl falsch positiver ErgebnisseS: Anzahl der als signifikant bezeichneten Merkmalem0: Anzahl der wirklich Null-Merkmalem: Gesamtzahl der Hypothesentests (Merkmale)
Die FDR bei einem bestimmten Schwellenwert t ist FDR(t). FDR(t) ≈ E[V(t)]/E[S(t)] –> die FDR bei einem bestimmten Schwellenwert kann geschätzt werden als die erwartete Anzahl falsch positiver Ergebnisse bei diesem Schwellenwert geteilt durch die erwartete Anzahl der als signifikant bezeichneten Merkmale an dieser Schwelle.
Wie schätzen wir E[S(t)] ab?
E[S(t)] ist einfach S(t), die Anzahl der beobachteten p-Werte ≤ t (dh die Anzahl der Merkmale, die wir beim gewählten Schwellenwert als signifikant bezeichnen). Die Wahrscheinlichkeit, dass ein Null-p-Wert is t ist, ist t (bei Alpha=0,05 besteht eine Wahrscheinlichkeit von 5%, dass ein wirklich Null-Merkmal einen p-Wert hat, der zufällig unter dem Schwellenwert liegt und daher als signifikant bezeichnet wird).
Wie schätzen wir E[V(t)] ab?
E[V(t)]=m0*t –> die erwartete Anzahl falsch positiver Ergebnisse für einen bestimmten Schwellenwert ist gleich der Anzahl der wirklich Null-Merkmale mal der Wahrscheinlichkeit, dass ein Null-Merkmal als signifikant bezeichnet wird.
Wie schätzen wir m0 ab?
Der wahre Wert von m0 ist unbekannt. Wir können den Anteil der Features schätzen, die wirklich null sind, m0/m = π0.
Wir nehmen an, dass p-Werte von Null-Features gleichmäßig verteilt sind (eine flache Verteilung haben) zwischen [0,1]. Die Höhe der flachen Verteilung ergibt eine konservative Schätzung des Gesamtanteils der Null-p-Werte, 0. Das nachfolgende Bild aus Storey und Tibshirani (2003) ist beispielsweise ein Dichtehistogramm von 3000 p-Werten für 3000 Gene aus einer Genexpressionsstudie. Die gestrichelte Linie repräsentiert die Höhe des flachen Teils des Histogramms. Wir erwarten, dass wirklich Null-Features diese flache Verteilung von [0,1] bilden und wirklich alternative Features näher an 0 liegen.

π0 wird als quantifiziert, wobei Lambda der Abstimmungsparameter ist (zum Beispiel könnten wir im obigen Bild Lambda=0.5 wählen, da die Verteilung nach einem p-Wert von 0.5 ziemlich flach ist. Der Anteil der wirklich Null-Features entspricht der Anzahl von p -Werte größer als Lambda geteilt durch m(1-Lambda) Wenn sich Lambda 0 nähert (wenn der größte Teil der Verteilung flach ist), wird der Nenner ungefähr m sein, ebenso wie der Zähler, da die Mehrheit der p-Werte größer ist als Lambda, und π0 ist ungefähr 1 (alle Features sind null).
Die Wahl des Lambda wird in der Regel durch statistische Programme automatisiert.

Nachdem wir nun π0 abgeschätzt haben, können wir FDR(t) abschätzen als
Der Zähler für diese Gleichung ist nur die erwartete Anzahl falsch positiver Ergebnisse, da π0*m die geschätzte Anzahl von wirklich Null-Hypothesen ist und t die Wahrscheinlichkeit ist, dass ein wirklich Null-Merkmal als signifikant bezeichnet wird (unter dem Schwellenwert t liegt). Der Nenner ist, wie oben erwähnt, einfach die Anzahl der als signifikant bezeichneten Merkmale.
Der q-Wert für ein Merkmal ist dann der minimale FDR, der erreicht werden kann, wenn dieses Merkmal als signifikant bezeichnet wird.

(Anmerkung: Die obigen Definitionen gehen davon aus, dass m sehr groß ist, also S>0. Wenn S=0 ist der FDR undefiniert, so dass in der Statistikliteratur die Größe E[V/?S?|S>0]?*Pr (S>0) wird als FDR verwendet.Alternativ wird der positive FDR (pFDR) verwendet, der E[V/S?|S>0] ist.Vgl. Benjamini und Hochberg (1995) und Storey und Tibshirani (2003) für mehr Informationen.)

Lesungen

Lehrbücher & Kapitel

JÜNGSTE FORTSCHRITTE IN DER BIOSTATISTIK (Band 4):
Fehlerkennungsraten, Überlebensanalyse und verwandte Themen
Herausgegeben von Manish Bhattacharjee (New Jersey Institute of Technology, USA), Sunil K Dhar (New Jersey Institute of Technology, USA) & Sundarraman Subramanian (New Jersey Institute of Technology, USA).
http://www.worldscibooks.com/lifesci/8010.html
Das erste Kapitel dieses Buches bietet einen Überblick über FDR-Kontrollverfahren, die von führenden Statistikern auf diesem Gebiet vorgeschlagen wurden, und schlägt eine neue adaptive Methode vor, die die FDR kontrolliert, wenn die p-Werte unabhängig oder positiv abhängig sind.

Intuitive Biostatistik: Ein nichtmathematischer Leitfaden für statistisches Denken
von Harvey Motulsky
http://www.amazon.com/Intuitive-Biostatistics-Nonmathematical-Statistical-Thinking/dp/product-description/0199730067
Dies ist ein Statistikbuch, das für Wissenschaftler geschrieben wurde, denen ein komplexer statistischer Hintergrund fehlt. Teil E, Herausforderungen in der Statistik, erklärt in Laiensprache das Problem des Mehrfachvergleichs und die verschiedenen Umgangsformen, einschließlich grundlegender Beschreibungen der familienbezogenen Fehlerquote und der FDR.

Großräumige Inferenz: empirische Bayes-Methoden zum Schätzen, Testen und Vorhersagen
von Efron, B. (2010). Institut für Mathematische Statistik-Monographien, Cambridge University Press.
http://www.amazon.com/gp/product/0521192498/ref=as_li_ss_tl?ie=UTF8&tag=chrprobboo-20&linkCode=as2&camp=1789&creative=390957&creativeASIN=0521192498
Dies ist ein Buch, das das Konzept des FDR überprüft und seinen Wert nicht nur als Schätzverfahren, sondern auch als Signifikanztestobjekt untersucht. Der Autor liefert auch eine empirische Bewertung der Genauigkeit von FDR-Schätzungen.

Methodische Artikel

Benjamini, Y. und Y. Hochberg (1995). Kontrolle der Rate falscher Entdeckungen: Ein praktischer und leistungsstarker Ansatz für Mehrfachtests. Zeitschrift der Royal Statistical Society. Serie B (methodologisch) 57(1): 289-300.
Dieses Papier von 1995 war die erste formale Beschreibung von FDR. Die Autoren erklären mathematisch, wie sich die FDR auf die familienweise Fehlerrate (FWER) bezieht, geben ein einfaches Beispiel für die Verwendung der FDR und führen eine Simulationsstudie durch, die die Leistungsfähigkeit des FDR-Verfahrens im Vergleich zu Verfahren vom Bonferroni-Typ demonstriert.

Storey, J. D. und R. Tibshirani (2003). Statistische Bedeutung für genomweite Studien.Proceedings of the National Academy of Sciences 100(16): 9440-9445.
Dieser Artikel erklärt, was der FDR ist und warum er für genomweite Studien wichtig ist, und erklärt, wie der FDR geschätzt werden kann. Es gibt Beispiele für Situationen, in denen die FDR nützlich wäre, und bietet ein Durcharbeitungsbeispiel dafür, wie die Autoren die FDR verwendet haben, um differenzielle Genexpressionsdaten von Microarrays zu analysieren.

Stockwerk JD. (2010) Falsche Entdeckungsraten. In International Encyclopedia of Statistical Science, Lovric M (Herausgeber).
Ein sehr guter Artikel über die FDR-Kontrolle, den positiven FDR (pFDR) und die Abhängigkeit. Empfohlen, um einen vereinfachten Überblick über den FDR und verwandte Methoden für Mehrfachvergleiche zu erhalten.

brandenburg vs. ohio

Reiner A, Yekutieli D, Benjamini Y: Identifizierung unterschiedlich exprimierter Gene mit falschen Entdeckungsratenkontrollverfahren. Bioinformatik 2003, 19(3):368-375.
Dieser Artikel verwendet simulierte Microarray-Daten, um drei auf Resampling basierende FDR-Kontrollverfahren mit dem Benjamini-Hochberg-Verfahren zu vergleichen. Die erneute Stichprobenziehung der Teststatistiken erfolgt, um nicht die Verteilung der Teststatistik der differentiellen Expression jedes Gens anzunehmen.

Verhoeven KJF, Simonsen KL, McIntyre LM: Implementieren der Falscherkennungsratenkontrolle: Erhöhen Sie Ihre Leistung. Oikos 2005, 108(3):643-647.
Dieses Papier erklärt das Benjamini-Hochberg-Verfahren, liefert ein Simulationsbeispiel und diskutiert neuere Entwicklungen im FDR-Bereich, die mehr Leistung liefern können als die ursprüngliche FDR-Methode.

Stan Pounds und Cheng Cheng (2004)Verbesserung der Schätzung der falschen Entdeckungsrate Bioinformatik Vol. 2, No. 20 Nr. 11 2004, Seiten 1737–1745.
Dieses Papier stellt eine Methode vor, die als LOESS-Histogramm (SPLOSH) bezeichnet wird. Diese Methode wird vorgeschlagen, um die bedingte FDR (cFDR) zu schätzen, den erwarteten Anteil falsch positiver Ergebnisse, der davon abhängt, dass k „signifikante“ Befunde vorliegen.

Daniel Yekutieli, Yoav Benjamini (1998)Resampling-basierte falsche Entdeckungsrate, die mehrere Testverfahren für korrelierte Teststatistiken steuert Journal of Statistical Planning and Inference 82 (1999) 171-196.
Dieses Papier stellt ein neues FDR-Kontrollverfahren vor, um mit miteinander korrelierten Teststatistiken umzugehen. Das Verfahren beinhaltet das Berechnen eines p-Werts basierend auf einem Resampling. Die Eigenschaften dieser Methode werden mit Hilfe einer Simulationsstudie bewertet.

Yoav Benjamini und Daniel Yekutieli (2001)Die Kontrolle der Falschentdeckungsrate bei Mehrfachtests unter Abhängigkeit The Annals of Statistics 2001, Vol. 2, No. 29, Nr. 4, 1165–1188.
Die ursprünglich vorgeschlagene FDR-Methode war für die Verwendung beim Testen mehrerer Hypothesen unabhängiger Teststatistiken vorgesehen. Dieses Papier zeigt, dass die ursprüngliche FDR-Methode auch die FDR kontrolliert, wenn die Teststatistiken eine positive Regressionsabhängigkeit von jeder der Teststatistiken aufweisen, die der wahren Nullhypothese entsprechen. Ein Beispiel für abhängige Teststatistiken wäre das Testen mehrerer Endpunkte zwischen Behandlungs- und Kontrollgruppen in einer klinischen Studie.

John D. Storey (2003) Die positive Fehlentdeckungsrate: Eine Bayessche Interpretation und der q-Wert The Annals of Statistics 2003, Vol. 2, No. 31, Nr. 6, 2013–2035.
Dieses Papier definiert die positive False Discovery Rate (pFDR), die die erwartete Anzahl von False Positives aus allen Tests ist, die als signifikant bezeichnet werden, wenn mindestens ein positiver Befund vorliegt. Das Papier bietet auch eine Bayessche Interpretation des pFDR.

Yudi Pawitan, Stefan Michiels, Serge Koscielny, Arief Gusnanto und Alexander Ploner (2005)Falsche Entdeckungsrate, Sensitivität und Stichprobengröße für Mikroarray-Studien Bioinformatik Vol. 2, No. 21 Nr. 13 2005, Seiten 3017–3024.
Dieses Papier beschreibt eine Methode zur Berechnung der Stichprobengröße für eine Vergleichsstudie mit zwei Stichproben basierend auf FDR-Kontrolle und -Sensitivität.

Grant GR, Liu J, Stoeckert CJ Jr. (2005)Ein praktischer Ansatz mit der Rate falscher Entdeckungen zur Identifizierung von Mustern der differentiellen Expression in Microarray-Daten. Bioinformatik. 2005, 21(11): 2684-90.
Die Autoren beschreiben die Methoden der Permutationsschätzung und diskutieren Fragen bezüglich der Wahl von Statistik- und Datentransformationsmethoden durch Forscher. Die Leistungsoptimierung in Bezug auf die Verwendung von Microarray-Daten wird ebenfalls untersucht.

Jianqing Fan, Frederick L. Moore, Xu Han, Weijie Gu, Schätzung des Anteils falscher Entdeckungen unter willkürlicher Kovarianzabhängigkeit. J Am Stat Assoc. 2012; 107(499): 1019–1035.
Dieses Papier schlägt und beschreibt eine Methode zur Kontrolle von FDR basierend auf einer Hauptfaktor-Approximation der Kovarianzmatrix der Teststatistik.

Anwendungsartikel

Han S, Lee K-M, Park SK, Lee JE, Ahn HS, Shin HY, Kang HJ, Koo HH, Seo JJ, Choi JE et al.: Genomweite Assoziationsstudie der akuten lymphatischen Leukämie bei Kindern in Korea. Leukämieforschung 2010, 34(10):1271-1274.
Dies war eine genomweite Assoziationsstudie (GWAS), die eine Million Einzelnukleotidpolymorphismen (SNPs) auf Assoziation mit akuter lymphatischer Leukämie (ALL) bei Kindern testete. Sie kontrollierten die FDR bei 0,2 und fanden heraus, dass 6 SNPs in 4 verschiedenen Genen stark mit dem ALL-Risiko verbunden sind.

Pedersen, K. S., Bamlet, W. R., Oberg, A. L., de Andrade, M., Matsumoto, M. E., Tang, H., Thibodeau, S. N., Petersen, G. M. und Wang, L. (2011). Die DNA-Methylierungssignatur von Leukozyten unterscheidet Patienten mit Bauchspeicheldrüsenkrebs von gesunden Kontrollpersonen. PLoS ONE 6, e18223.
Diese Studie kontrollierte einen FDR<0.05 when looking for differentially methylated genes between pancreatic adenoma patients and healthy controls to find epigenetic biomarkers of disease.

Daniel W. Lin, Liesel M. FitzGerald, Rong Fu, Erika M. Kwon, Siqun Lilly Zheng, Suzanne et.al. Genetische Varianten in den LEPR-, CRY1-, RNASEL-, IL4- und ARVCF-Genen sind prognostische Marker für Prostatakrebs-spezifisch Mortalität (2011), Cancer Epidemiol Biomarkers Prev.2011;20:1928-1936. Diese Studie untersuchte die Variation ausgewählter Kandidatengene im Zusammenhang mit dem Auftreten von Prostatakrebs, um ihren prognostischen Wert bei Personen mit hohem Risiko zu testen. FDR wurde verwendet, um Single-Nukleotid-Polymorphismen (SNPs) einzustufen und die wichtigsten SNPs von Interesse zu identifizieren.

Ist es sicher, in Hiroshima zu leben?

Radom-Aizik S, Zaldivar F, Leu S-Y, Adams GR, Oliver S, Cooper DM: Auswirkungen von Training auf die microRNA-Expression in peripheren mononuklearen Blutzellen junger Männer. Klinische und Translationale Wissenschaft 2012, 5(1):32-38.
Diese Studie untersuchte die Veränderung der microRNA-Expression vor und nach dem Training mit einem Microarray. Sie verwendeten das Benjamini-Hochberg-Verfahren, um die FDR bei 0,05 zu kontrollieren, und fanden heraus, dass 34 von 236 microRNAs unterschiedlich exprimiert wurden. Aus diesen 34 wählten die Forscher dann microRNAs aus, die mit Real-Time-PCR bestätigt wurden.

Webseiten

R Statistikpaket
http://genomine.org/qvalue/results.html
Annotierter R-Code zur Analyse von Daten im Paper von Storey und Tibshirani (2003), einschließlich Link zur Datendatei. Dieser Code kann angepasst werden, um mit beliebigen Array-Daten zu arbeiten.

http://www.bioconductor.org/packages/release/bioc/html/qvalue.html
qvalue-Paket für R.

http://journal.r-project.org/archive/2009-1/RJournal_2009-1.pdf

Journal R Project ist eine von Experten begutachtete Open-Access-Publikation der R Foundation for Statistical Computing. Dieser Band enthält einen Artikel mit dem Titel „Sample Size Estimation While Controling False Discovery Rates for Microarray Experiments“ von Megan Orr und Peng Liu. Spezifische Funktionen und detaillierte Beispiele werden bereitgestellt.

http://strimmerlab.org/notes/fdr.html
Diese Website bietet eine Liste von R-Software für die FDR-Analyse mit Links zu ihren Homepages für eine Beschreibung der Paketfunktionen.

SAS
http://support.sas.com/documentation/cdl/en/statug/63347/HTML/default/viewer.htm#statug_multtest_sect001.htm
Beschreibung von PROC MULTTEST in SAS, das Optionen zur Steuerung des FDR mit verschiedenen Methoden bietet.

ZUSTAND
http://www.stata-journal.com/article.html?article=st0209
Stellt STATA-Befehle zur Berechnung von q-Werten für Mehrfachtestverfahren bereit (FDR-angepasste q-Werte berechnen).

FDR_allgemeine Webressourcen
http://www.math.tau.ac.il/~ybenja/fdr/index.htm
Website, die von den Statistikern der Universität Tel Aviv verwaltet wird, die die FDR erstmals offiziell eingeführt haben.

http://www.math.tau.ac.il/~ybenja/
Auf dieser FDR-Website sind viele Referenzen verfügbar. Vortrag über FDR steht zur Überprüfung zur Verfügung.

http://www.cbil.upenn.edu/PaGE/fdr.html
Schöne, prägnante Erklärung von FDR. Eine nützliche Zusammenfassung mit Beispiel auf einen Blick wird bereitgestellt.

http://www.rowett.ac.uk/~gwh/False-positives-and-the-qvalue.pdf
Ein kurzer Überblick über False Positives und q-Werte.

Kurse

Ein Tutorial zur Kontrolle von falschen Entdeckungen von Christopher R. Genovese Department of Statistics Carnegie Mellon University.
Dieses Powerpoint ist ein sehr gründliches Tutorial für jemanden, der daran interessiert ist, die mathematischen Grundlagen des FDR und Variationen des FDR zu erlernen.

Mehrere Tests von Joshua Akey, Department of Genome Sciences, University of Washington.
Dieses Powerpoint bietet ein sehr intuitives Verständnis von Mehrfachvergleichen und dem FDR. Dieser Vortrag ist gut für diejenigen, die ein einfaches Verständnis des FDR ohne viel Mathematik suchen.

Schätzung der lokalen Fehlerkennungsrate bei der Erkennung von Differenzausdrücken zwischen zwei Klassen.
Präsentation von Geoffrey MacLachlan, Professor, University of Queensland, Australien.
www.youtube.com/watch?v=J4wn9_LGPcY
Dieser Videovortrag war hilfreich, um mehr über den lokalen FDR zu erfahren, d. h. die Wahrscheinlichkeit, dass eine bestimmte Hypothese aufgrund ihrer spezifischen Teststatistik oder ihres p-Werts wahr ist.

Verfahren zur Kontrolle der Rate falscher Entdeckungen für diskrete Tests
Vortrag von Ruth Heller, Professorin, Institut für Statistik und Operations Research. Universität Tel Aviv
http://www.youtube.com/watch?v=IGjElkd4eS8
Dieser Videovortrag war hilfreich, um mehr über die Anwendung der FDR-Steuerung auf diskrete Daten zu erfahren. Es werden mehrere Step-Up- und Step-Down-Verfahren für die FDR-Steuerung beim Umgang mit diskreten Daten diskutiert. Alternativen, die letztendlich zur Leistungssteigerung beitragen, werden überprüft.

Interessante Artikel

Tipp Der Redaktion

Gambia Press Union gegen Generalstaatsanwalt
Gambia Press Union gegen Generalstaatsanwalt
Columbia Global Freedom of Expression möchte das Verständnis der internationalen und nationalen Normen und Institutionen fördern, die den freien Informations- und Meinungsfluss in einer vernetzten globalen Gemeinschaft mit großen gemeinsamen Herausforderungen am besten schützen. Um seine Mission zu erfüllen, führt und beauftragt Global Freedom of Expression Forschungs- und Politikprojekte, organisiert Veranstaltungen und Konferenzen und beteiligt sich an globalen Debatten über den Schutz der Meinungs- und Informationsfreiheit im 21. Jahrhundert.
Klinik für Rehabilitation und Regenerative Medizin
Klinik für Rehabilitation und Regenerative Medizin
Was ist Multiple Sklerose (MS)? Multiple Sklerose (MS) ist eine chronische Erkrankung des zentralen Nervensystems. Es wird angenommen, dass es sich um eine Autoimmunerkrankung handelt. Es ist ein unvorhersehbarer Zustand, der relativ gutartig, behindernd oder verheerend sein kann. Einige Personen mit MS können leicht betroffen sein, während andere ihre Fähigkeit zum klaren Sehen, Schreiben, Sprechen oder Gehen verlieren können, wenn die Kommunikation zwischen dem Gehirn und anderen Körperteilen unterbrochen wird.
Mario Diaz de Leon
Mario Diaz de Leon
Mario Diaz de Leon (DMA, Komposition 2013) ist ein Komponist und Multiinstrumentalist, dessen Werk moderne klassische Musik, experimentelle elektronische Musik, extreme Metal und kreative improvisierte Musik umfasst. Seine klassischen Werke sind bekannt für ihre kühne Kombination aus akustischen Instrumenten und Elektronik , und sind auf vier Aufnahmen in voller Länge dokumentiert.
Katherine M. Franke
Katherine M. Franke
Katherine Franke ist James L. Dohr Professor of Law an der Columbia University, wo sie auch das Center for Gender and Sexuality Law leitet und Fakultätsdirektorin des Law, Rights, and Religion Project ist. Sie ist Mitglied des Exekutivkomitees des Instituts für Frauen-, Geschlechter- und Sexualforschung und des Center for Palestine Studies. Sie gehört zu den führenden Wissenschaftlern des Landes, die über Recht, Rasse, Religion und Rechte schreibt. Franke ist auch Gründer und Fakultätsleiter des Law, Rights, and Religion Project, einer Denkfabrik mit Sitz an der Columbia Law School, die Richtlinien und Vordenker zu den komplexen Interaktionen zwischen Religionsfreiheit und anderen Grundrechten entwickelt. Im Jahr 2021 startete Professor Franke das ERA-Projekt, einen Think Tank für Recht und Politik, um wissenschaftlich fundierte Forschung, Grundsatzpapiere, Expertenratgeber und strategische Führung zum Equal Rights Amendment (ERA) zur US-Verfassung und zur Rolle der US-Verfassung zu entwickeln ERA bei der Förderung der größeren Sache der geschlechtsspezifischen Gerechtigkeit. Ihr neuestes Buch Repair: Redeeming the Promise of Abolition (Haymarket, 2019) plädiert heute für rassistische Reparationen, indem es die Geschichte von Experimenten in South Carolina und Mississippi in den 1860er Jahren erzählt, bei denen Freigelassenen ausdrücklich Land als Wiedergutmachung für die Versklavung gegeben wurde und ließ es dann von der Regierung wegnehmen. Wedlocked: The Perils of Marriage Equality (NYU Press, 2015) betrachtete die Kosten der Eheschließung für gleichgeschlechtliche Paare heute und für Afroamerikaner am Ende des Bürgerkriegs. 2011 erhielt Franke ein Guggenheim-Stipendium, um für Wedlocked zu forschen. Neben ihrer Tätigkeit an der Law School arbeitete sie regelmäßig in Palästina, bis ihr der Staat Israel im Frühjahr 2018 unter Berufung auf ihr Eintreten für die Menschenrechte der Palästinenser die Wiedereinreise untersagte. Sie ist auch Vorsitzende des Board of Directors des Center for Constitutional Rights mit Sitz in New York City. Bevor er an die Law School kam, war Franke außerordentlicher Professor für Rechtswissenschaften an der Fordham Law School und dem University of Arizona College of Law. Von 1990 bis 1991 war sie Geschäftsführerin der National Lawyers Guild. Davor arbeitete sie für die New York City Commission on Human Rights und gründete das AIDS and Employment Project. Download der Biografie von Professor Franke (PDF) Download des Fotos von Professor Franke
Lee Hsien Loong gegen Roy Ngerng Yi Ling
Lee Hsien Loong gegen Roy Ngerng Yi Ling
Columbia Global Freedom of Expression möchte das Verständnis der internationalen und nationalen Normen und Institutionen fördern, die den freien Informations- und Meinungsfluss in einer vernetzten globalen Gemeinschaft mit großen gemeinsamen Herausforderungen am besten schützen. Um seine Mission zu erfüllen, führt und beauftragt Global Freedom of Expression Forschungs- und Politikprojekte, organisiert Veranstaltungen und Konferenzen und beteiligt sich an globalen Debatten über den Schutz der Meinungs- und Informationsfreiheit im 21. Jahrhundert.
Kessler gegen Stadt Charlottesville
Kessler gegen Stadt Charlottesville
Columbia Global Freedom of Expression möchte das Verständnis der internationalen und nationalen Normen und Institutionen fördern, die den freien Informations- und Meinungsfluss in einer vernetzten globalen Gemeinschaft mit großen gemeinsamen Herausforderungen am besten schützen. Um seine Mission zu erfüllen, führt Global Freedom of Expression Forschungs- und Politikprojekte durch und beauftragt sie, organisiert Veranstaltungen und Konferenzen und beteiligt sich an globalen Debatten über den Schutz der Meinungs- und Informationsfreiheit im 21. Jahrhundert.
Was bedeutet es, virtuell zu graduieren?
Was bedeutet es, virtuell zu graduieren?
Der Senior Class President von Columbia Engineering erinnert sich an alles, was Columbia für ihn repräsentiert hat.