Vyhledávání v JavaScriptu

Pokud nemáme na vyhledávání moc vysoké nároky, není moc složité ho na serveru implementovat. Třeba na tomto serveru se používá prosté:

<?php
mysql_query("SELECT * FROM clanky WHERE clanek LIKE '%" . mysql_real_escape_string($_GET["search"]) . "%'");
?>

Využívá se faktu, že všechna data jsou uložena v databázi, kam podle mě jedině patří. Pokud je dat v databázi větší množství, je možné využít např. fulltextové indexy. Pokud jsou texty i v souborech, můžeme je procházet třeba funkcí glob a text hledat např. funkcí strpos.

Co ale v případě, kdy služby serveru nelze použít? Texty z tohoto serveru je možné stáhnout a pracovat s nimi bez připojení k Internetu. Vyhledávat v nich jde potom samozřejmě třeba příkazem grep nebo jiným obecným vyhledáváním souborů, z prostředí webového prohlížeče by to ale jistě bylo pohodlnější.

V moderních prohlížečích lze toto vyhledávání zajistit díky technologii AJAX:

<table cellpadding="3" cellspacing="0">
<tbody id="vysledky"></tbody>
</table>

<script type="text/javascript">
function obsluha(xmlhttp) {
	if (xmlhttp.readyState == 4) {
		var match = xmlhttp.responseText.match(/<h1><a href="(.*)">(.*)<\/a><\/h1>([^˙]*)<!-- konec textu -->/);
		if (match && (match[2] + match[3]).search(search) > -1) {
			nalezeno++;
			var tr = document.getElementById('vysledky').appendChild(document.createElement("TR"));
			tr.appendChild(document.createElement("TD")).innerHTML = '<a href="' + match[1] + '">' + match[2] + '</a>';
		}
		zbyva--;
		if (!zbyva && !nalezeno) {
			alert('Zadaný řetězec nebyl nalezen.');
		}
	}
}

var search = new RegExp(location.search.replace('?search=', ''), 'i');
var nalezeno = 0;
var zbyva = 1; // celkový počet prohledávaných souborů
send_xmlhttprequest(obsluha, 'GET', 'ajax.html');
// další soubory k prohledání
</script>

Prohlížeč začne při zavolání funkcí send_xmlhttprequest paralelně prohledávat všechny soubory a do tabulky vypisovat odkazy na ty, kde byl hledaný text nalezen. Při vytváření tohoto kódu jsem narazil na několik nástrah:

Nelze použít objekt responseXML, protože prohlížeč při načítání souboru z disku nepošle správné hlavičky.
Pro výpis dat se pochopitelně nedá volat metoda document.write. Funkce obsluha se totiž nevolá z konkrétního místa dokumentu, ale volá ji sám prohlížeč při stažení dat.
V IE mi nefungoval ani kód document.getElementById('vysledky').innerHTML += '…', bylo nutné použít DOM.
Pokud výsledky chceme vypisovat do tabulky, měla by tato tabulka obsahovat značku tbody. IE si ji totiž jinak domyslí a pracuje s ní i na úrovni DOMu, Firefox ne.
Znak . v regulárním výrazu strefí jakýkoliv znak kromě konce řádku. Na rozdíl od PHP ale neexistuje modifikátor s, který by toto chování změnil. Pokud se jako náhrada použije regulární výraz (.|\n), je kód v IE příšerně pomalý. Vyřešit je to možné tak, že se \n před hledáním nahradí jiným znakem nebo se použije výčet všech možných znaků včetně znaku konce řádku (nebo negace nepoužitého znaku).

Přijde mi, že k řešení je potřeba se spíše prokličkovat přes řadu nástrah, z nichž největší je rozdílné chování prohlížečů.

Přijďte si o tomto tématu popovídat na školení JavaScript a AJAX.

Jakub Vrána, Řešení problému, 10.5.2006

Diskuse

Martin:

lol! Tenhle blog mě nikdy nezklame, sranda je tu větší než na thedailywtf.com! Autorovy nápady stojí za to. Vyhledávání offline pomocí AJAX přímo v kódu stránek..... cha cha cha cha
Programátor opravdu není ten, kdo umí řadit příkazy za sebe a rozchodit kdejakou nesmyslnou myšlenku...

10.5.2006 08:32:55

Garçon:

Taky jsem se musel smát a říkal jsem si, že je to legrační blbost, ale pak jsem si řek, že třeba pro hledání v dokumentaci na disku to může být řešení.

10.5.2006 12:37:17

Jakub Vrána :

Nevím, co ti na myšlence připadá nesmyslného. Uživatelé jsou zvyklí na hledání přímo na stránkách a když ho nejde realizovat pohodlně na straně serveru (ať už u zmiňované verze pro stažení nebo třeba u HTML nápovědy), tak popisuji, jak se dá realizovat v JavaScriptu.

Co převratného jsi nám vlastně mudrováním o "řazení příkazů za sebe" chtěl sdělit?

(reakce na) 11.5.2006 00:33:19

Spud:

Me to pripada jako velice elegantni reseni napriklad u CD prezentaci, supr!

11.5.2006 11:30:25

l:

Je to dobre, to jen Martin je nejaky divny.

(reakce na) 18.5.2006 20:06:44

ATom:

Hezké. Jen aby někdo nezapomněl na předchozí články o SQL injection a fakt nedal do SQL příkazu jen $_GET[search] ;-)

10.5.2006 08:56:28

Jakub Vrána :

V patičce stránky je uvedeno, že skripty předpokládají nastavení magic_quotes_gpc=On. S tímto nastavením je kód zcela v pořádku, více to rozebírám právě ve zmiňovaném článku: http://php.vrana.cz/obrana-proti-sql-injection.php.

10.5.2006 11:49:34

Garçon:

Začnu číst patičky, slibuju. ;-)

10.5.2006 12:30:05

Jakub Vrána :

Kód jsem předělal na magic_quotes_gpc = Off a zmínil jsem to v patičce.

(reakce na) 11.5.2009 05:31:58

JKa:

Možná by stálo za to zmínit i možnost jednoduchého vyhledávání na stránkách pomocí Google a modifikátoru site:www.example.com. U stránek, kde nejsou časté změny to může stačit.

10.5.2006 17:32:43

Jakub Vrána :

Toto vyhledávání ale pochopitelně nejde použít v případě, kdy stránky nejsou veřejně dostupné a třeba se ani nezobrazují přes webový server. Právě na tento případ je totiž článek zaměřen.

10.5.2006 17:49:22

Jiný Martin:

Martinovi z prvního postu: Vrátil jsem se k tomuto článku, jen abych napsal, že právě pomocí regexpů v JS má řešeno vyhledávání třeba nápověda k Adobe Photoshop.
Zkus příště trochu přemýšlet, než začneš zaklínat thedailywtf.

27.5.2006 12:49:39

Lukas:

Ciste pro lajka, kde do toho scriptu vstupuje hledany retezec?

4.12.2006 10:45:53

Danoha:

Taky by mě zajímalo.

30.7.2007 17:30:36

Jakub Vrána :

V parametru URL search.

(reakce na) 4.8.2007 22:34:57

Magnus:

Dobrý den.

Chtěl bych se zeptat, když odesílám a přijímám data ze serveru pomocí AJAXu, pak nelze daný soubor ochránit pomocí .htaccess (deny from all). Je nějaká možnost, jak by mi mohl útočník soubor poškodit?
Data v souboru ošetřuji například mysql_real_escape_string, pokud data vyhledávám z databáze, takže SQL injection se stát nemůže. Výpis textu ošetřuji pomocí htmlspecialchars() proti XSS.
Je důležitá nějaká další funkce?

Děkuji za odpověď, ochrana není zrovna má silná stránka. :-(

10.10.2011 15:45:11

Jakub Vrána :

AJAX funguje přes HTTP protokol, takže .htaccess se na něj normálně vztahuje.

Další ochrana záleží na tom, co skript přesně dělá. Mohu vám doporučit školení http://php.vrana.cz/skoleni-bezpecnost-php-aplikaci.php.

10.10.2011 15:57:57

Magnus:

Děkuji za rychlou odpověď.
Ještě bych se rád zeptal, pokud v adresáři mám soubor .htaccess a v něm "deny from all", tak nemohu poslat přes AJAX data, protože mám zakázaný přístup do souboru.
Proto vždy používám podmínky

if (isset($_POST['odeslana_data'])) { // script }

, aby se při zadání názvu souboru přes URL vykreslila pouze bílá stránka (tzn. když nebyla odeslána žádná data pomocí metody POST, uložení do DB se neprovede).

Ale někde jsem se dočetl, že lze POSTem data odesílat i jinak, než přes webový formulář. Proto i ve scriptu zjišťuji, jestli může tento uživatel odeslat data (například zda je přihlášen, má práva apod.).
Stačilo by mi vědět, zda mohu kvůli bezpečnosti systému takto AJAX používat.

Omlouvám se za nejspíš zbytečné dotazy, ovšem v mém věku (15) je bohužel školení nepřípustné.

10.10.2011 16:36:13

David:

Zdravím,
rád bych použil tento kód pro offline vyhledávání ve všech html souborech, které jsou v jedné složce text, nebo číslo, které zadám do inputu na hlavní stránce...
už jsem se v diskusi dočetl,že data ro hledání získám přes GET a search, teď už mi jen zbývá otázka, jak nastavit, ve které složce chci ty soubory prohledávat?

Děkuji

20.7.2012 09:30:41

Jakub Vrána :

Skript neprohledává složku, ale jednotlivé soubory. Ty je potřeba vyjmenovat pomocí řádků send_xmlhttprequest(obsluha, 'GET', 'ajax.html'). Skript k výpisu adresářů nemá přístup.

21.7.2012 18:24:24

Michal:

Zdravím. Chci se zeptat jestli se od doby kdy byl vydán tento článek něco zásadně změnilo. Podpora ze strany prohlížečů a pod. Lze nějak efektivně přes JS prohledávat v offline souborech ? Případně jestli jsou nějaké offline vyhledávací enginy, které byste doporučil.

Děkuji.

17.6.2013 18:12:59

Vita:

Zdravím,
tak jsem si vytvořil index.htm ... nakopíroval do něj celý kód ajax.html ve fci send_xmlhttprequest() zmenil na moji stránku a spustil stránku v prohlížeči v tomto tvaru: index.htm?search="ajax" .... a nic se nezobrazilo... kde je chyba?

28.3.2014 13:19:18

Jakub Vrána :

Možná by něco mohlo být v chybové konzoli prohlížeče.

1.4.2014 06:25:44

Ondra:

Taky mi to nejde nějak rozjet.:-/

16.10.2014 21:26:59

Diskuse je zrušena z důvodu spamu.

Navigace

PHP triky

Kupte si mou knihu

Reklama

Hledáte-li programátora nebo naopak sami programujete a nemáte do čeho píchnout, využijte služeb portálu nezávislých profesionálů Na volné noze.

Web běží na serveru

Váš hosting

Články podle skupin

Výběr článků

Nejnovější články

Normy a manuály

Další projekty

. Můžeme si tykat. Skripty předpokládají nastavení: magic_quotes_gpc=Off, magic_quotes_runtime=Off, error_reporting=E_ALL & ~E_NOTICE a očekávají předchozí zavolání mysql_set_charset. Skripty by měly být funkční v PHP >= 4.3 a PHP >= 5.0.