VB.NET,C#

[VB.NET] 정규식을 이용한 HTML 태그 제거 삭제 방법

지니허니 2024. 2. 5. 17:15

 

VB.NET에서 HTML 태그를 제거하는 방법은 다양합니다. 여러 방법 중 하나는 정규식(Regular Expression)을 사용하는 것입니다. 아래는 VB.NET에서 HTML 태그를 제거하는 간단한 예제 코드입니다.

 

 

모듈소스:


Imports System.Text.RegularExpressions
Module Module1
    Function RemoveHtmlTags( input As String ) As String
        ' 정규식을 사용하여 HTML 태그를 제거.
        Dim pattern As String = "<.*?>"
        Dim plainText As String = Regex.Replace(input, pattern, "")
        Return plainText
    End Function
End Module

 

 

폼소스:

Imports System.IO
Imports System.Text

Public Class Form1
    
Private Sub Button1_Click(sender As Object, e As EventArgs) Handles Button1.Click
       Dim htmlString As String = "<p>This is <b>HTML</b> text with <a href='#'>links</a>.</p>"

       htmlString = RemoveHtmlTags(htmlString)

       MsgBox(htmlString, vbInformation, "html 태그제거")

End Sub

 

 

이 코드에서 RemoveHtmlTags 함수는 입력된 HTML 문자열에서 정규식을 사용하여 HTML 태그를 제거합니다. 이 메서드를 사용하면 HTML 태그가 제거된 텍스트만 남게 됩니다.

 

정규식을 사용하는 방법은 간단하지만 모든 HTML 상황에 완벽하게 대응하지는 못합니다. HTML 파싱이나 라이브러리를 사용하는 것이 더 정확한 결과를 얻을 수 있는 방법 중 하나입니다.

 

[VB.NET] TML 태그 제거 삭제 방법.txt
0.00MB