tirar LF
\n => ""
tirar CR
\r => ""
tirar início e fim do html
[^_]*_<(.*)>_.* => _<\1>_
tirar tudo entre tags
>_[^_]*_< => >__<
_< => _^
>_ => ^_