str_url_todomain é uma função focada em URL. URLs contendo parâmetros que são URLs, por exemplo WebArchive usa até sem ?, faz arte da URL a segunda URL, http://web.archive.org/web/20140215025729/http://www.uol.com.br/.
Apesar de parecer "oportuno" aproveitar a regex, o desacoplamento requer que um simples trim e higenizações mais complexas sejam feitas antes de enviar a URL, algo como str_url_todomain(trim(url)) é mais correto. Sugiro portanto reverter este commit.
Talvez o que falte é uma função de extração das URLs de um texto, str_url_extract(text), retornando uma array de URLs contidas no input.
str_url_todomain é uma função focada em URL. URLs contendo parâmetros que são URLs, por exemplo WebArchive usa até sem
?, faz arte da URL a segunda URL,http://web.archive.org/web/20140215025729/http://www.uol.com.br/.Apesar de parecer "oportuno" aproveitar a regex, o desacoplamento requer que um simples trim e higenizações mais complexas sejam feitas antes de enviar a URL, algo como
str_url_todomain(trim(url))é mais correto. Sugiro portanto reverter este commit.Talvez o que falte é uma função de extração das URLs de um texto,
str_url_extract(text), retornando uma array de URLs contidas no input.