HtmlProcessor - advanced html page scraper

Parse with CSS style
Parse with original JS listener
Parse with original image assets
Customizable target URL & output path

Screenshot

Usage

Add import in your class

import io.pcholkin.processor.HtmlProcessor;

Invoke executor

public class Main {
    public static void main(String[] args) {
        try {
            HtmlProcessor.process()
                    .buildURL("https://github.com/NikitaPcholkin/")
                    .parseCssStyle(true)
                    .parseJs(true)
                    .parseImages(true)
                    .outputFilePath("output.html")
                    .build();
            System.out.println("HTML file saved with name: output.html");
        } catch (IOException | InterruptedException | ScriptException | URISyntaxException e) {
            e.printStackTrace();
        }
    }
}

Name		Name	Last commit message	Last commit date
Latest commit History 13 Commits
.idea		.idea
ART		ART
gradle/wrapper		gradle/wrapper
src/main/java/io/pcholkin/processor		src/main/java/io/pcholkin/processor
.gitignore		.gitignore
README.MD		README.MD
build.gradle		build.gradle
gradlew		gradlew
gradlew.bat		gradlew.bat
settings.gradle		settings.gradle

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

HtmlProcessor - advanced html page scraper

Screenshot

Usage

Add import in your class

Invoke executor

About

Releases 1

Packages

Languages

NikitaPcholkin/HtmlProcessor

Folders and files

Latest commit

History

Repository files navigation

HtmlProcessor - advanced html page scraper

Screenshot

Usage

Add import in your class

Invoke executor

About

Resources

Stars

Watchers

Forks

Releases 1

Packages 0

Languages

Packages