<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Butschek.de &#187; urldecode</title>
	<atom:link href="http://www.butschek.de/tag/urldecode/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.butschek.de</link>
	<description>Linux, Server &#38; Co</description>
	<lastBuildDate>Wed, 16 Nov 2011 21:06:30 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.3.1</generator>
	<atom:link rel='hub' href='http://www.butschek.de/?pushpress=hub'/>
		<item>
		<title>urldecode auf der Shell</title>
		<link>http://www.butschek.de/2008/09/21/urldecode-shell/</link>
		<comments>http://www.butschek.de/2008/09/21/urldecode-shell/#comments</comments>
		<pubDate>Sun, 21 Sep 2008 11:39:19 +0000</pubDate>
		<dc:creator>Michael Butschek</dc:creator>
				<category><![CDATA[IT]]></category>
		<category><![CDATA[LST]]></category>
		<category><![CDATA[Linux]]></category>
		<category><![CDATA[perl]]></category>
		<category><![CDATA[Shell]]></category>
		<category><![CDATA[urldecode]]></category>

		<guid isPermaLink="false">http://www.butschek.de/?p=10</guid>
		<description><![CDATA[Wer hin und wieder schon mal in einem Apache-Log die Referer durchsucht hat, kennt das Problem mit der Zeichenkodierung: Sonderzeichen werden als zweistellige hexadezimale Zeichen mit vorangestelltem Prozentzeichen dargestellt. Aus &#8216;Wörter mit Äh, Üh und Öh&#8217; wird so schnell ein &#8230; <a href="http://www.butschek.de/2008/09/21/urldecode-shell/">Weiterlesen <span class="meta-nav">&#8594;</span></a>]]></description>
			<content:encoded><![CDATA[<p><a href="/files/blog/2008/internet-globe.jpg" rel="lightbox[14]"><img style="float: left;" title="Globus" src="/files/blog/2008/internet-globe-small.jpg" alt="" width="200" height="200" /></a>Wer hin und wieder schon mal in einem Apache-Log die <a href="http://de.wikipedia.org/wiki/Referer">Referer</a> durchsucht hat, kennt das Problem mit der <a href="http://de.wikipedia.org/wiki/URL_Encoding">Zeichenkodierung</a>: Sonderzeichen werden als zweistellige hexadezimale Zeichen mit vorangestelltem Prozentzeichen dargestellt. Aus &#8216;Wörter mit Äh, Üh und Öh&#8217; wird so schnell ein &#8216;W%F6rter+mit+%C4h%2C+%DCh+und+%D6h&#8217;, was für den Admin wirklich schwer zu lesen sein dürfte.</p>
<p>Eine ganz einfache Möglichkeit der Umwandlung bietet Perl durch die Möglichkeit, die Suchergebnisse eines regulären Ausdrucks durch eine <a href="http://de.wikipedia.org/wiki/R%C3%BCckruffunktion">Callback-Funktion</a> zu schicken:<br clear="all" /></p>
<pre>echo 'W%F6rter+mit+%C4h%2C+%DCh+und+%D6h'
  | perl -pe 's/%([A-Fa-f0-9]{2})/pack("C", hex($1))/seg'</pre>
<p>Nur die Pluszeichen (welche für Space eingesetzt werden) bleiben bestehen, das erschwert die Lesbarkeit jedoch kaum. Falls es doch stört, einfach das Ergebnis nochmal durch &#8216;<a title="tr(1)" href="/man/tr">tr</a>&#8216; schicken&#8230;</p>
]]></content:encoded>
			<wfw:commentRss>http://www.butschek.de/2008/09/21/urldecode-shell/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>

