DESARROLLADOR
Como extraer tags HTML usando expresiones regularesPor Ronald Flores
Es posible que en algún momento necesitemos obtener datos de un usuario en nuestras páginas. No obstante, muchas veces personas se aprovechan de los formularios o "form submits" para enviar todo tipo de spam, especialmente el que contiene código en HTML.
La siguiente función en ASP clásico permite extraer todos los tags de una hilera o "string". El resultado es un texto que no incluye nada códigos HTML ni cualquier texto entremedio. Esto es especialmente útil al momento de capturar una página y dear solamente el texto relevante.
Cómo utilizar la funciónUtilizar esta función es muy fácil. Simplemente llame la misma de la siguiente manera:
<% str_html = "<a href=""target.htm"">ENLACE Y CODIGO HTML</a>" stripped_text = stripHTML(str_html) response.write stripped_text %>
Note que la función eliminará todo lo que sea HTML y dejará afuera lo que esté fuera del código HTML. El resultado de este código es el siguiente:
ENLACE Y CODIGO HTML
La función a continuación.
Function stripHTML(strHTML) 'Strips the HTML tags from strHTML
Dim objRegExp, strOutput Set objRegExp = New Regexp
objRegExp.IgnoreCase = True objRegExp.Global = True objRegExp.Pattern = "<(.|\n)+?>"
'Replace all HTML tag matches with the empty string strOutput = objRegExp.Replace(strHTML, "") 'Replace all < and > with < and > strOutput = Replace(strOutput, "<", "<") strOutput = Replace(strOutput, ">", ">") stripHTML = strOutput 'Return the value of strOutput
Set objRegExp = Nothing response.write stripHTML End Function
Este artículo ha sido visto 929 veces.
Más artículos y Noticias
|