Understanding Image Sharpness

Thread Status
Hello, There was no answer in this thread for more than 30 days.
It can take a long time to get an up-to-date response or contact with relevant users.

falconeye

Sehr aktives NF Mitglied
Registriert
Hi Zusammen,

ich mache diesen neuen Thread auf, um mit Mathias (masi) und allen anderen Interessierten über die Themen zu diskutieren, die in meinem Papier Understanding Image Sharpness angesprochen werden.

Das Papier findet sich hier:
http://www.falklumo.com/lumolabs/articles/sharpness/index.html

Der englische Threadtitel soll Zufallsbesucher abhalten, denn hier geht es nicht um Bildkunst ;)

Den Anfang soll die laufende Diskussion machen, welche Blurbreite den Effekt der Defokussierung am treffendsten charakterisiert, also in etwa MTF50 der Defocus-MTF entspricht. Und wie sich diese Unschärfe verrechnet.

Eine erste Referenz findet sich hier:
http://spie.org/x32396.xml

Offensichtlich wird das Thema wellenoptisch beackert, mit einer OPD = ~ delta/8N^2

Das könnte sogar ungefähr hinkommen, denn mit delta=60micron Fokusungenauigkeit (einem Wert, den ich öfter messe) und N=4 komme ich dann auf 0.48 micron OPD oder 0.85 Lambda.

Dafür finden sich wiederum hier Formeln:
http://www2.ensc.sfu.ca/~glennc/e376/e376l20a.pdf
 
Anzeigen
Erste Quelle, die so etwas wie das RMS-Addieren der Blurbreiten für Defokus und Beugung erlaubt:

http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.42.4407&rep=rep1&type=pdf

Nur dass hier die entspr. Breiten über Standardabweichungen der PSFs definiert werden und nicht über MTF50. Immerhin wird dort auch etwas über die Beziehung der wellenoptischen und strahlenotischen Behandlung des Defokus gesagt...

OK Und dort wird die Basisveröffentlichung benannt: H.H.Hopkins von 1955. U.a. China online: http://lib.semi.ac.cn:8080/tsh/dzzy...ining Papers of a Mathematical and/231-91.pdf

Jetzt muss man sich das nur noch reinziehen. Alle anderen zitieren eigentlich immer nur ...

Und bisher hat es wohl noch niemand in die Begriffswelt der Fotographen übersetzt...
 
Kommentar
Eine erste Referenz findet sich hier:
http://spie.org/x32396.xml

Offensichtlich wird das Thema wellenoptisch beackert, mit einer OPD = ~ delta/8N^2

Und da steckt dann gleich das erste Missverständnis meinerseits, glaube ich.

Ich bin in dieses Thema ja von der Schärfentiefe-Schiene aus reingeraten. Und da habe ich irgendwann angefangen, den Begriff Defokusunschärfe zu benutzen einfach als Übersetzung von "Defocus Blur" und mit der Bedeutung der Unschärfe in der Abbildung eines Objekts, das außerhalb der Fokusebene liegt, und der Abhängigkeit dieser Unschärfe von der Lage zur Fokusebene. In meinem kleinen Modell ist aber die Linse/das Objektiv ideal und perfekt fokussiert, wie das eben in der einfachen Schärfentieferechnerei so gemacht wird.

Und diese "Defokusunschärfe" habe ich dann irgendwann mit der Beugungsunschärfe kombiniert, und das eben per "RMS" und mittlerweile mit der Annahme, der effektive Durchmesser bei der Beugung sei der Radius des Airy-Scheibchens. Für mich ergibt das plausiblere Ergebnisse als bei anderen, die dort den Durchmesser annehmen.

In der Referenz oben scheint "Defokus" aber für einen Fokusfehler in der Fokusebene zu stehen, wenn ich das auf die schnelle richtig überblicke. So was kommt bei mir ja bislang gar nicht vor, meine Linse ist ja ideal und frei von Abbildungsfehlern.

Und außerdem bin ich ja immer noch beim klassischen Modell der zulässigen Zerstreuungskreise aus der Schäerfentieferechnerei, und das würde ich auch gern beibehalten. Ich glaube, das ist für nicht-Physiker wenigstens noch halbwegs verständlich (man kennt es ja, und sei es von Skalen auf Objektiven). Ich würde deshalb wohl versuchen, alle Erkenntnisse rund um Übertragungsfunktionen und MTF50 wieder zurück zu übersetzen. Aber vielleicht ist das sinnlos und es versteht sowieso keiner?



Gruß, Matthias
 
Kommentar
Und da steckt dann gleich das erste Missverständnis meinerseits, glaube ich.

Ich bin in dieses Thema ja von der Schärfentiefe-Schiene aus reingeraten.
...
eben per "RMS" und mittlerweile mit der Annahme, der effektive Durchmesser bei der Beugung sei der Radius des Airy-Scheibchens.
...
In der Referenz oben scheint "Defokus" aber für einen Fokusfehler in der Fokusebene zu stehen
...
Und außerdem bin ich ja immer noch beim klassischen Modell der zulässigen Zerstreuungskreise aus der Schäerfentieferechnerei, und das würde ich auch gern beibehalten.
Mathias, hier liegt kein Missverständnis vor.

Ich verfolge genau die gleiche Frage wie Du.

Aber offensichtlich ist das Thema komplexer als wie annahmen und wurde 1955 von Hopkins gelöst.

Er nennt den Abstand von der wahren Fokusebene "focus defect", aber das ist das gleiche. Er weisst darauf hin, eine perfekt abbildende Linse zu betrachten.

Hopkins löst das Problem wellenoptisch, offensichtlich ist es so einfacher. Er löst es aber zusätzlich auch klassisch und vergleicht die Ergebnisse, wobei wellenoptisch die Referenz darstellt. Und zeigt, dass die klassische Rechnung für größere Fehlfokussierungen genau wird. Damit löst er das Problem gleich mit, wie Beugung und Defokussierung zu verrechnen sind. Die Defokussierung wird dann über die Phasendifferenz in der Wellenfront ausgedrückt, wenn sie nicht mehr auf den Fokuspunkt zuläuft. Hopkins zeigt auch, dass geringe Fehlfokussierungen keinen negativen Einfluß haben, ein Ergebnis, das man aus einer RMS Betrachtung erwarten würde.

Und wie Du versuche ich nur, diese Ergebnisse in unsere Sprache zurückzuübersetzen. Ein erster Erfolg war die Arbeit von Subbarao von 1999, der auch beweist, dass sich gewisse Größen (er nennt sie "Spread Parameter") per RMS verrechnen lassen, die sich per Standardabweichung aus der PSF berechnen lassen. Das ist dann allerdings weder der Airy-Radius oder-Durchmesser noch der Unschärfe/Zerstreuungskreisdurchmesser und beide einem Wert entsprechend, der wohl wieder anders als die zu MTF50 gehörende Blurbreite ist, die bei idealer Abbildung ja der 10-90% Anstiegsbreite einer Kante entspricht.

Was ich in meinem Papier versuche, ist, die verschiedenen Beiträge zur (10-90% Kante bzw. zu MTF50) zu quantifizieren und eine Faustformel anzugegen, wie man sie verrechnen darf. Subbarao beweist in seiner Arbeit, dass man zwei zur Defokussierung und Beugung gehörende Werte per RMS verrechnen darf, aber es bleibt unklar, wie diese zur 10-90% Kante bzw. zu MTF50 passen.

Dies gilt insbesondere, als sein Spread Parameter für Beugung unendlich ist und er ihn per Computersimulation auf 1 setzt, was immer das bedeuten soll ... Damit ist sein Spread Parameter für uns untauglich, aber es ist ein Anfang.

Subbarao sagt, die Arbeit von Levi und Austing "Tables of modulation transfer function of defocused perfect lens" von 1968 zu nutzen, die die Formeln von Hopkins vereinfacht hätten. Aber ich habe nur kostenpflichtige Quellen dafür gefunden, obwohl schon 44 Jahre alt :(

Lies die Arbeit von Subbarao, die ist noch am einfachsten zu verstehen (man muss ja nicht nachrechnen) und stellt auch die Verbindung zur klassischen Circle of Confusion CoC her, einem Begriff, der uns was sagt. Subbarao schreibt auch "value of focus defect (or the amount of defocus) is denoted by Delta". Du siehst also, wir reden über das gleiche. Wellenoptisch ist halt alles ein Defekt -- muss man sich erst mal reindenken ;)


Vielleicht ist auch eine frühere Arbeit von Subbarao hilfreich (1989): http://www.ee.sunysb.edu/~cvl/Publications/MSubbarao_TR1989.pdf

Dort führt einen Paramater ein, der 1/sqrt(2) des Zerstreuungskreises beträgt.

Die ganze Homepage von Subbarao ist interessant: http://www.ee.sunysb.edu/~cvl/
Offensichtlich promoviert eine ganze Armee von Chinesen und Indern in Ney York über das und ähnliche Themen ;)

Dort ist auch die Originalreferenz seiner Arbeit, die ich oben zitiere: http://www.ee.sunysb.edu/~cvl/Publications/MSubbarao_TR1990.pdf
Aber auch dort fehlt "Fig.1", die Abb., auf die er sich im Text bezieht.
 
Kommentar
Nochmal moin!


Bevor ich das nun alles durchacker, fällt mir noch was ganz anderes ein:

Viele Leute z.B. hier im Forum sehen die Pixelgröße irgendwie als absolute Grenze an, die für "pixelscharfe Fotos" nicht überschritten werden darf. In meinem xls-Blatt behandle ich dagegen die Sensorauflösung als weiteren Bestandteil der Unschärfe im betrachteten Bild, derzeit neben Beugung und Defokus/Schärfentiefe. Für "Defokus" nehme ich die Zerstreuungskreise des einfachen strahlenoptischen Modells, wie sie jeder Schärfentieferechner benutzt. Für die Beugung den halben Durchmesser der Airy-Scheibe bei 550nm. Und für "Pixel" einfach die idealisierte Kantenlänge eines Pixels (Wurzel(Sensorfläche/Pixelzahl)). Und die 3 Anteile addiere ich dann per RMS.

Aus Deinem Papier hatte ich schon entnommen, dass MTF50 und 10-90-Anstieg stark von der Bearbeitung/Schärfung abhängen, das wird also für meine "Pixelunschärfe" nicht anders sein. Würdest Du trotzdem annehmen, dass die Kantenlänge ein gutes Maß für eine durchschnittliche Kamera mit normalem AA-Filter und normaler Schärfung ist? Oder gibt es Gründe, da viel größere oder kleinere Werte anzunehmen?

Ach, und anders als Du benutze ich meine Erkenntnisse nicht für irgendwelche Bearbeitungsalgorithmen oder so, sondern nur um mir und anderen interessierten grundsätzliche Zusammenhänge zu veranschaulichen. Es muss also nicht besonders genau sein und ich will auch nicht zwischen verschiedenen Kameras oder Objektiven unterscheiden müssen. Einfach nur das zeigen, was sich aus wenigen Parametern (Brennweite, Blende, Pixelzahl usw.) schlussfolgern lässt.


Gruß, Matthias
 
Kommentar
Ach, und anders als Du benutze ich meine Erkenntnisse nicht für irgendwelche Bearbeitungsalgorithmen oder so, sondern nur um mir und anderen interessierten grundsätzliche Zusammenhänge zu veranschaulichen. Es muss also nicht besonders genau sein und ich will auch nicht zwischen verschiedenen Kameras oder Objektiven unterscheiden müssen. Einfach nur das zeigen, was sich aus wenigen Parametern (Brennweite, Blende, Pixelzahl usw.) schlussfolgern lässt.
Ich verfolge genau das gleiche Ziel.

Dummerweise (vgl. Abs. 2.1, der Text unter Abb. 7: "The coefficient ≈1/5 differs from the expected value (2/3)") weichen unterschiedliche Betrachtungsweisen zu sehr voneinander ab (um Faktoren 3!!). Daher kommt man nicht darum herum, das einfach mal korrekt zu behandeln. Die Energieverteilung in einer Airyscheibe ist einfach zu verschieden von der der Defokusscheibe.

Der einzige Unterschied ist vielleicht nur der, dass ich bei unscharfen Bildern die Fehllage der Fokusebene in µm wissen will, um den Herstellern bei fehlerhaftem AF auf den Zahn zu fühlen.
 
Kommentar
Ok, ich habe erste MTFs, muss sie "nur" noch umrechnen und MTF50 in Abhängigkeit der CoC bestimmen ...

Anbei meine wellenoptische Rechnung für Hoppins n=1/4, 1,2,3,4.

-- gelöscht (s.u.) --
 
Kommentar
Na, das sind die MTFs für verschieden starke Fehlfokussierungen, jeweils auf die Ortsfrequenzen bis zur Beugungsgrenze (2.0) bezogen. Die MTF für Beugung selbst ist auch eingezeichnet, die MTF inkl. Beugung ergibt sich durch Multiplikation mit dieser.

Die Funktionen sind komplex. Man sieht aber schon, dass die Ortsfrequenz, für die sich 50% ergibt, einen Sprung bei kleinen Fehlfokussierungen macht (wegen der Buckel). Der Effekt ist in der Literatur wohl auch akzeptiert und heisst Spurious Resolution bei Defokussierung.

Ich stelle das in meinem Paper dann lesbar zusammen. Ich dachte nur, Du wolltest mitmachen, weil Du doch auch schon länger am Problem knabberst ...
 
Kommentar
Vielleicht noch eine Notiz, auf wessen Arbeit unsere Überlegungen aufbauen, nämlich die von
Ηarold Horace Hopkins *1918 +1994 http://en.wikipedia.org/wiki/Harold_Hopkins

Zweimal für den Physiknobelpreis vorgeschlagen und hat auch das Zoomobjektiv erfunden ...

Hopkins gilt als Wegbereiter der wellenoptischen Berechnung von Objektiven und damit als Vater aller modernen Objektivkonstruktionen seit den 1950/60er Jahren.
 
Kommentar
Ich stelle das in meinem Paper dann lesbar zusammen. Ich dachte nur, Du wolltest mitmachen, weil Du doch auch schon länger am Problem knabberst ...

Doch doch, würde ich gern. Aber im Moment ist mir das alles noch viel zu weit weg. Und ich muss mich leider die meiste Zeit des Tages mit Schallwellen statt Lichtwellen beschäftigen. Das ist zwar ähnlich, aber der Zweck ist ein ganz anderer. :D


Gruß, Matthias
 
Kommentar
Nochmal moin!


Wenn ich das jetzt richtig verstehe, ist die "spurious resolution" ein Effekt, der ausschließlich deshalb auftritt, weil für die MTF ein Muster von "parallelen Linien" untersucht wird. An einzelnen Kanten, Linien oder Punkten sieht man davon nichts, oder doch? Wenn ja, kann ich mir bislang nicht erklären, wie das zustandekommt.


Gruß, Matthias
 
Kommentar
So, Version 1.2 meines Papers "Understanding Image Sharpness" ist fertig.

Hier noch mal der Link:

-> http://www.falklumo.com/lumolabs/articles/sharpness/index.html

Die Kapitel bauen nun anders aufeinander auf und vor allem

"2.3. Defocus"

ist völlig neu. Ich konnte die bisherigen Ungereimtheiten alle ausmerzen. Wer den Artikel lesen will, bitte per

PDF -> http://www.falklumo.com/lumolabs/articles/sharpness/ImageSharpness.pdf

(die HTML Fassung hat etliche Layoutfehler).


Ein wesentliches Resultat für Matthias:

- Die Beugungsblurbreite ist 1.02 r_Airy
(r_Airy=Radius der Airy Disk).

- Und die Defokusblurbreite ist 0.71 (CoC – N/5.6 [µm])
(CoC = Durchmesser des Circle of Confusion, N = f-stop).

Der Abzug des Terms N/5.6 gilt für grünes Licht und trägt den wellenoptischen Effekten heuristisch optimal Rechnung.

Die MTF für Defokus für einen Wert der CoC von 0.055µm*N sieht so aus:

DefocusMTFexact_25.gif


Für einige mehr Werte (der Wert oben entspricht dabei der dritten Kurve von links) sieht es so aus:

DefocusMTFexact_21.gif


Dabei läuft auf der x-Achse die Ortsfrequenz f von Null bis f0=0.55µm*N, wobei auf den letzten Wert skaliert wird (f/f0: 0 ... 1). Die blaue Kurve ist die MTF der Beugung.


Damit kann nun die Unschärfe bei Defokussierung exakt bestimmt werden bzw. aus der Unschärfe der Fokusfehler berechnet werden, was für Kameratests interessant wäre.
 
Kommentar
Der Artikel liefert auch eine Genauigkeitsvorgabe für den AF, d.h., eine Genauigkeit, bis zu der AF Fehler keine signifikante Auswirkung haben (>=80% Kontrasterhalt an der Nyquistfrequenz).

Um z.B. diese volle Schärfe bei f/2.8 mit der D800 auszuloten, muss der AF die Fokusebene auf 11 µm genau einstellen können. Bei f/1.4 auf 5 µm, bei f/5.6 auf 22 µm. Ich bin mir nicht sicher, dass der Multicam3500 auf solche Werte spezifiziert wurde ... Ein Test wird es zeigen. Bisher sind mir eher Werte um 30µm begegnet, wobei ich Nikon noch nicht vermessen habe.

Eine AF Genauigkeit von 10µm (1/10 eines Haares) wäre jedenfalls schon eine ordentliche ingenieurstechnische Leistung, die auch ein Kontrast-AF oft nicht bringt. Hierfür hätte man dann einen zentralen f/2.8 AF Fokuspunkt erwartet. Auch ein Schwanken des Fotographen mit 50mm Objektiv bei 2m Abstand um nur 2.5cm ist schon grenzwertig (15µm). Die Fokusgenauigkeit ist unabhängig von Blende, Brennweite und Fokusabstand relativ konstant, da nur der Winkel der Triangulation eingeht, die mit dem f-stop des AF Punktes feststeht. Sie wird mit besserem Licht und besserem Kontrast allerdings besser, bis dann irgendwann Kalibrierung, CA der Fokus-Relaylinsen, Pixel-Auflösung des AF Sensors und mechanisches Spiel des AF-Antriebs zuschlagen.

Um bzgl. des AF auf der sicheren Seite für die volle 36MP Auflösung zu sein, wird man also ggfs. bei f/8 shooten, also jenseits des Sweet Spots der besseren Objektive. Hier sieht man auch, dass das für APSC unerreichbares Terrain wäre, da dort sogar die doppelte Genauigkeit nötig wäre (5 statt 10µm), man bei f/16 aber keine scharfen Bilder mehr bekommt. Andersherum ist das Thema 40MP bei Mittelformat noch relativ entspannt ;)
 
Kommentar
Ein wesentliches Resultat für Matthias:

- Die Beugungsblurbreite ist 1.02 r_Airy
(r_Airy=Radius der Airy Disk).

Oh oh, dann hab ich mich bisher ja um 2% verschätzt! :eek:

Vielen Dank! Ich werde mir die Herleitung mal angucken, wenn ich wieder sinnvoll pdf lesen kann. Im Moment sitze ich mit extrem langsamem Internetzugang in Göttingen und beschäftige mich mit viel unübersichtlicheren Sachen.

Auf die schnelle stolpere ich aber erstmal über die symmetrischen (periodischen?) Kurven im 2. Diagramm. Und auch die Skalierung auf f0=0.55µm*N verstehe ich nicht. Das ist doch gar keine Frequenz, sondern eine Wellenlänge. Da fehlt irgendwie ein Bruchstrich.



Gruß, Matthias
 
Kommentar
Mir schwirren Reynolds-, Rayleigh-, Prandtl- und Nusselt-Zahlen durch den Kopf und in das pdf kann ich immer noch nicht gucken. Aber hier bleibe ich jetzt erstmal hängen:

Die MTF für Defokus für einen Wert der CoC von 0.055µm*N sieht so aus:

Das bedeutet eine "Fehllage" der Fokusebene (bezogen auf den Sensor) von 1/10 Lichtwellenlänge. Und damit bekommst Du eine MTF50 bei etwa 0,08/Lichtwellenlänge, also etwa 150Lp/mm. Das sehe ich ein. Was ich aber nicht einsehe, warum die MTF bei 1/Lichtwellenlänge wieder auf 1 ansteigt. Ist das wieder die "spurious resolution"? Warum dann bei der Lichtwellenlänge? Oder rechnest Du mit kohärentem Licht? Oder bin ich völlig auf dem Holzweg (was ich nicht ausschließen will)?


Gruß, Matthias
 
Kommentar
Auf die schnelle stolpere ich aber erstmal über die symmetrischen (periodischen?) Kurven im 2. Diagramm. Und auch die Skalierung auf f0=0.55µm*N verstehe ich nicht. Das ist doch gar keine Frequenz, sondern eine Wellenlänge. Da fehlt irgendwie ein Bruchstrich.

Ja, im Paper stehts richtig, f0=1/(lambda N), also 1/(0.55µm*N). (in cycles per (lambda N)).

Ich rechne dann mit Frequenzen k=f/f0 (von 0 bis 1) und Längen in Einheiten von (lambda N). Die MTF im oberen Bild ist für einen Zertreuungskreis von coc=10 lambda N. N ist natürlich der F-Stop.

Das bedeutet eine "Fehllage" der Fokusebene (bezogen auf den Sensor) von 1/10 Lichtwellenlänge. Und damit bekommst Du eine MTF50 bei etwa 0,08/Lichtwellenlänge, also etwa 150Lp/mm. Das sehe ich ein. Was ich aber nicht einsehe, warum die MTF bei 1/Lichtwellenlänge wieder auf 1 ansteigt. Ist das wieder die "spurious resolution"? Warum dann bei der Lichtwellenlänge?

Ok, hier hast Du jetzt N vergessen, aber deine Zahlen stimmen auch für N=1 nicht. Der Wert 1/10 ist nicht die Fokusfehllage df, sondern 1/coc in (lambda N) Einheiten, also coc/N = 5.5µm. df ist dann coc*N = 5.5µm N^2. Bei N=2.8 also z.B. df=44µm.

Meine Faustregel: lambda N = 1 µm für f/1.8 :)

Dass die MTF bei 1/(lambda N) wieder auf 1 ansteigt ist eine Folge der Tatsache, dass die MTF_defocus um k=1/2 symmetrisch ist.

Diese Eigenschaft ist möglicherweise bisher unpubliziert!

Publiziert wurde bisher immer nur MTF_defocus+diffraction. Ich habe mir die Mühe gemacht, mal

MTF_defocus(k) = MTF_defocus+diffraction(k) / MTF_diffraction(k)

zu betrachten und siehe da: Symmetrie! :up: :up:

MTF_defocus(k) = MTF_defocus(1-k)

(im Intervall 0 ... 1, die Funktion ist weder periodisch noch gilt die Beziehung ausserhalb des Intervalls oben)

Das ist möglicherweise ein wichtiges Ergebnis, denn MTF_diffraction(k) ist einfach zu berechnen und die Terme für MTF_defocus(k) konvergieren schnell für kleine k, aber sehr langsam für k in der Nähe von 1.

Physikalisch heisst dass, dass eine Circle of Confusion, egal wie groß, das Ergebnis gegenüber Beugung nicht mehr weiter verschlechtert, wenn man an die absolute Beugungsgrenze 1/(lambda N) geht: der verbleibende Kontrast (an der Grenze selbst natürlich Null) wird vom Fokuspunkt unabhängig. Man sieht also quasi nur noch die Beugung der Linsenpupille, egal worauf man fokussiert.

Praktisch ist das natürlich irrelevant, da mit der Beugunf auch jede andere Abbildung verschwindet. Aber es gibt dennoch eine Auswirkung: Nähert sich die CoC dem Beugungskreis, so wird der Effekt der Defokussierung kleiner als die klassische Rechnung ergeben würde. Dem trage ich mit einer Korrektur Rechnung, die ich ermittelt habe:

CoC -> CoC' = CoC - 1/3 (lambda N)

Der Vorfaktor ist übrigens nicht 0.8, sondern 1/Sqrt(2); Also:

b_defocus = 1/Sqrt(2) max(0, CoC - 1/3 (lambda N))

Die Gesamtunschärfe folgt dann wie oben erwähnt:

b_defocus+diffraction^2 = b_defocus^2 + b_diffraction^2

mit b_diffraction = 1.02 r_Airy. Die Gültigkeit der RMS-Formel habe ich überprüft.
 
Kommentar
-Anzeige-
Zurück
Oben Unten