登录
首页 >  Golang >  Go问答

抓取网页内容的方法使用 Golang

来源:stackoverflow

时间:2024-03-08 13:54:17 195浏览 收藏

知识点掌握了,还需要不断练习才能熟练运用。下面golang学习网给大家带来一个Golang开发实战,手把手教大家学习《抓取网页内容的方法使用 Golang》,在实现功能的过程中也带大家重新温习相关知识点,温故而知新,回头看看说不定又有不一样的感悟!

问题内容

我是编程语言的初学者,正在学习 scrape。这样的评论能获取数据吗?

<tbody id="the-list">
<tr>
    <td valign="top" align="right">1.</td>
    <td valign="top">bekasi</td>
    <td valign="top">tambun</td>
    <td valign="top">selatan</td>
    <td valign="top">01.4.13.16.06.000013</td>
    <td valign="top">jalan</td>
    <td valign="top">perum bekasi griya asri</td>
    <td valign="top">1.500 m<sup>2</sup></td>
    <td valign="top" align="center">kantor</td>
    <td valign="top">400 m<sup>2</sup></td>
    <td valign="top" align="center">1998</td>            
    <td valign="top" align="center">> 200</td>

    <!--
    <td valign="top" align="center">-6.2245</td>
    <td valign="top" align="center">107.0827</td>
    -->

    <td valign="top" align="right">3</td>
    <td valign="top" align="right">7</td>
    <td valign="top" align="right">2</td>
    <td valign="top" align="right">150</td>
    <td valign="top">08888123</td>
    <td valign="top">-</td>

</tr>

希望结果能是这样的

1.;BEKASI;Tambun;Selatan;01.4.13.16.06.000013;Jalan;PERUM BEKASI GRIYA ASRI;1.500 m;Kantor;400 m;1998;200;-6.2245;107.0827;3;7;2;150;08888123;-

解决方案


goquery 是解析 html 内容的绝佳库。

html := `
      <table><tbody id="the-list">
         <tr>
            <td valign="top" align="right">1.</td>
            <td valign="top">BEKASI</td>
            <td valign="top">Tambun</td>
            <td valign="top">Selatan</td>
            <td valign="top">01.4.13.16.06.000013</td>
            <td valign="top">Jalan</td>
            <td valign="top">PERUM BEKASI GRIYA ASRI</td>
            <td valign="top">1.500 m<sup>2</sup></td>
            <td valign="top" align="center">Kantor</td>
            <td valign="top">400 m<sup>2</sup></td>
            <td valign="top" align="center">1998</td>            
            <td valign="top" align="center">> 200</td>

            <!--
            <td valign="top" align="center">-6.2245</td>
            <td valign="top" align="center">107.0827</td>
            -->

            <td valign="top" align="right">3</td>
            <td valign="top" align="right">7</td>
            <td valign="top" align="right">2</td>
            <td valign="top" align="right">150</td>
            <td valign="top">08888123</td>
            <td valign="top">-</td>

        </tr>
   </tbody></table>
`
    doc, _ := goquery.NewDocumentFromReader(strings.NewReader(html))
    sel := doc.Find("#the-list td")
    for i := range sel.Nodes{
        n := sel.Eq(i)
        fmt.Println(n.Text())
    }

好了,本文到此结束,带大家了解了《抓取网页内容的方法使用 Golang》,希望本文对你有所帮助!关注golang学习网公众号,给大家分享更多Golang知识!

声明:本文转载于:stackoverflow 如有侵犯,请联系study_golang@163.com删除
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>