In preparation of my thesis defence, I recently gave two more or less local talks at our university. The first took place on Jan 14th 2010, as part of the DKE-Doktorandenkolloquium. My talk covered the three major parts of my dissertation, namely the introduction of spatial cross-validation for yield prediction, variable importance measurements and a spatial clustering approach tailored to precision agriculture data. My direct supervisor happened to be there and gave me positive feedback and some things to waterproof for a final defence presentation of my thesis. Some questions could be preempted or at least I could prepare (for) the answers beforehand. The slides:slides-russ2010dkekoll.pdf.
Then, in fulfillment of our institute’s formal requirements for obtaining a PhD title, I gave my talk at the Doktorandentag on Feb 02 2010, which is some kind of preparatory talk for the final defence. Again, my talk went much better than the one before, even though it was heavily shortened. I guess there was some talk routine now, after the numerous conferences I went to. It seems that this was the second talk I gave in German during my PhD time. That’s why the slides are in German, too: slides-russ2010dday.pdf.
Anyway, here’s a short summary in German:
Mit der in den letzten Jahren stark zunehmenden Rationalisierung und Technisierung in der Landwirtschaft hat sich ein relativ junges Gebiet herausgebildet: Präzisionslandwirtschaft (precision agriculture). Dieses
Gebiet befindet sich an der Schnittstelle von Landwirtschaft und Informatik. Da aufgrund verbesserter und neuer Technologien wie (differentiellem) GPS, neuen Sensoren und bildgebenden Verfahren immer mehr Daten anfallen und gesammelt werden können, spielen hier insbesondere die Datenanalyse und das Data Mining eine zentrale Rolle, um diese Rohdaten in nützliches Wissen zu verwandeln.Im Vortrag werden einige Ansätze zu spezifischen Fragestellungen auf diesem Gebiet vorgestellt. Im ersten Teil des Vortrags wird die Herkunft der Daten genauer vorgestellt; ein Überblick über die verschiedenen Datenarten wird gegeben. Insbesondere ist hierbei die Unterscheidung zwischen räumlichen und nicht-räumlichen Daten erwähnenswert. Dies wird am Beispiel der Ertragsvorhersage genauer erläutert, wobei auf das Problem der räumlichen Autokorrelation näher eingegangen wird. Hierbei bietet sich die Möglichkeit, einige der Verfahren zur multidimensionalen Regressiono, die üblicherweise für nicht-räumliche Daten genutzt werden, auf räumliche Daten zu übertragen. Dazu wurde ein relativ simpler, generischer Ansatz entwickelt, der auf räumlichem Clustering beruht. Weiterführende Ideen zu diesem Thema, die den vorgestellten Ansatz benutzen, werden vorgestellt.