Skip to content

generalizacao perigosa #12

@ppKrauss

Description

@ppKrauss

str_url_todomain é uma função focada em URL. URLs contendo parâmetros que são URLs, por exemplo WebArchive usa até sem ?, faz arte da URL a segunda URL, http://web.archive.org/web/20140215025729/http://www.uol.com.br/.

Apesar de parecer "oportuno" aproveitar a regex, o desacoplamento requer que um simples trim e higenizações mais complexas sejam feitas antes de enviar a URL, algo como str_url_todomain(trim(url)) é mais correto. Sugiro portanto reverter este commit.

Talvez o que falte é uma função de extração das URLs de um texto, str_url_extract(text), retornando uma array de URLs contidas no input.

Metadata

Metadata

Assignees

Labels

bugSomething isn't working

Type

No type

Projects

No projects

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests

Issue actions