Escapování

Článek vyšel v rámci PHP okénka na serveru Root.cz.

V PHP jsou tři základní escapovací funkce, které se používají v různých situacích: addslashes, htmlspecialchars a urlencode.

Funkce addslashes se používá většinou při ukládání dat do databáze. Funkce doplní zpětné lomítko před apostrof, uvozovky a zpětné lomítko, takže text obsahující tyto znaky obalený apostrofy nebo uvozovkami může být bez obav použit v SQL dotazu. Při ukládání proměnných zvenku tuto funkci používejte pouze v případě, že není zapnutá direktiva magic_quotes_gpc, jinak dojde k dvojitému escapování. Některé databáze (např. MySQL) si vystačí s touto funkcí i při ukládání binárních dat, jiné pro escapování těchto dat potřebují použít vlastní funkci – např. SQLite používá funkci sqlite_escape_string.

Funkce htmlspecialchars se používá při vypisování textu, ve kterém nechceme interpretovat HTML značky – řídící znaky <>"& se převedou na odpovídající HTML entity – tedy např. < na <. Použití této funkce by mělo být samozřejmostí při vypisování neošetřeného textu a při používání proměnných v hodnotách atributů HTML značek, např. value.

<?php
// špatně - proměnná může obsahovat speciální HTML znaky
echo "<input name='search' value='$_GET[search]' />\n";

// špatně - proměnná může obsahovat apostrof
echo "<input name='search' value='" . htmlspecialchars($_GET["search"]) . "' />\n";

// správně - případné uvozovky jsou spolu s ostatními speciálními znaky defaultně escapovány
echo "<input name=\"search\" value=\"" . htmlspecialchars($_GET["search"]) . "\" />\n";

// správně - escapován bude i apostrof
echo "<input name='search' value='" . htmlspecialchars($_GET["search"], ENT_QUOTES) . "' />\n";
?>

Funkci htmlspecialchars je zvykem používat na výstupu, i když by ji z výkonnostních důvodů bylo někdy lepší použít např. už při ukládání dat do databáze. Nedělá se to ze dvou důvodů – jednak by kvůli větší délce escapovaného textu mohl být řetězec zkrácen přesto, že uživatel maximální délku nepřekročil, a jednak by někdo do databáze mohl nestandardním způsobem vložit neošetřená data, která by při výpisu způsobila paseku. Zkrácení řetězce může mít závažné důsledky, pokud k němu dojde uprostřed HTML entity – v extrémním případě to může vést až k nezobrazení celé stránky.

Funkce urlencode se používá při ošetřování řetězce předávaného v URL. Funkce nahradí všechny nealfanumerické znaky kromě -_. jejich URL reprezentací – tedy znakem % následovaným dvojicí hexadecimálních číslic (mezera se převede na +). Pokud tedy chceme vytvořit přehled nejčastěji hledaných výrazů, měli bychom to udělat nějak takhle:

<?php
$result = mysql_query("SELECT search, pocet FROM searches ORDER BY pocet DESC LIMIT 10");
while ($row = mysql_fetch_assoc($result)) {
    echo "<li><a href='?search=" . urlencode($row["search"]) . "'>" . htmlspecialchars($row["search"]) . "</a> ($row[pocet])</li>\n";
}
mysql_free_result($result);
?>

Kromě těchto základní escapovacích funkcí v PHP samozřejmě existují další, např. quotemeta nebo preg_quote. Vždycky jde o to zamyslet se nad tím, jestli v daném kontextu náhodou nejsou některé znaky speciální a pokud ano, tak je správně ošetřit. Podle mého názoru je správné escapování jedna z vlastností, které odlišují kvalitní webové aplikace od těch ostatních.

Jakub Vrána, Výuka, 27.4.2005

Diskuse

DFly:

a take rawUrlEncode()

27.4.2005 22:30:08

Kuba:

Jen malá poznámka ke zvýrazňovači php kódu - nevím proč není kód vypisován neproporcionálním fontem. Rozlišit znakové sekvence "' a '" je takhle dost netriviální (já to dělám tak, že označuju znak po znaku myší :o)

Escapování

Diskuse

DFly:

Kuba:

Jakub Vrána :

Kuba:

wyvern:

Jakub:

assimilate:

Martin Sirovy:

Jakub Vrána :

Martin Sirovy:

kozotoč:

Megaloman:

Jakub Vrána :

kozotoč:

Jakub Vrána :

v6ak:

Jakub Vrána :

David Grudl:

Jakub Vrána :

David Grudl:

Jakub Vrána :

v6ak:

kozotoč:

kozotoč:

Jakub Vrána :

kozotoč:

Jakub Vrána :

kozotoč:

Karel:

David Grudl:

Jakub Vrána :

kozotoč:

Jakub Vrána :

kozotoč:

Jakub Vrána :

kozotoč:

David Grudl:

Jakub Vrána :

kozotoč:

Jakub Vrána :

kozotoč:

Jakub Vrána :

kozotoč:

Jakub Vrána :

pojízdná kočka:

Jakub Vrána :

pojízdná kočka:

Jakub Vrána :

pojízdná kočka:

pojízdná kočka:

Jakub Vrána :

kozotoč:

Karel:

kozotoč:

kriplozoik:

v6ak:

Jakub Vrána :

v6ak:

cpbbt:

Michal:

Ogara:

v6ak:

Jakub Vrána :

pitr03:

Jakub Vrána :

Romana:

Navigace

PHP triky

Kupte si mou knihu

Reklama

Web běží na serveru

Články podle skupin

Výběr článků

Nejnovější články

Normy a manuály

Další projekty