Altigran S. da Silva

Adriano Veloso

J. Inf. Data Manag., 2011

On Using Wikipedia to Build Knowledge Bases for Information Extraction by Text Segmentation.

[BibT_eX]

[DOI]

Elton Serra

J. Inf. Data Manag., 2011

The Database and Information Retrieval Research Group at UFAM.

[BibT_eX]

[DOI]

Marco Antônio Pinheiro de Cristo

J. Inf. Data Manag., 2011

Lightweight methods for large-scale product categorization.

[BibT_eX]

[DOI]

Mauro Rojas Herrera

Wallace Favoreto Henrique

Marden S. Neubert

J. Assoc. Inf. Sci. Technol., 2011

A New Approach for Verifying URL Uniqueness in Web Crawlers.

[BibT_eX]

[DOI]

Marco Antônio Pinheiro de Cristo

Cristiano R. de Carvalho

Proceedings of the String Processing and Information Retrieval, 2011

Joint unsupervised structure discovery and information extraction.

[BibT_eX]

[DOI]

Daniel Oliveira

Proceedings of the ACM SIGMOD International Conference on Management of Data, 2011

A site oriented method for segmenting web pages.

[BibT_eX]

[DOI]

Edisson Braga Araújo

Proceedings of the Proceeding of the 34th International ACM SIGIR Conference on Research and Development in Information Retrieval, 2011

A source independent framework for research paper recommendation.

[BibT_eX]

[DOI]

Cristiano Nascimento

Proceedings of the 2011 Joint International Conference on Digital Libraries, 2011

Building a research social network from an individual perspective.

[BibT_eX]

[DOI]

Mirella M. Moro

Clodoveu A. Davis Jr.

Allan J. C. Silva

Carolina A. S. Bigonha

Daniel Hasan Dalip

Eduardo M. Barbosa

Peterson S. Procópio Jr.

Rafael Odon de Alencar

Thiago N. C. Cardoso

Thiago Salles

Proceedings of the 2011 Joint International Conference on Digital Libraries, 2011

Semi-supervised genetic programming for classification.

[BibT_eX]

[DOI]

Filipe de Lima Arcanjo

Gisele L. Pappa

Paulo Viana Bicalho

Wagner Meira Jr.

Proceedings of the 13th Annual Genetic and Evolutionary Computation Conference, 2011

Multiple keyword-based queries over XML streams.

[BibT_eX]

[DOI]

Felipe da C. Hummel

Mirella M. Moro

Proceedings of the 20th ACM Conference on Information and Knowledge Management, 2011

2010

A Probabilistic Approach for Automatically Filling Form-Based Web Interfaces.

[BibT_eX]

[DOI]

Guilherme A. Toda

Proc. VLDB Endow., 2010

Adaptive and Flexible Blocking for Record Linkage Tasks.

[BibT_eX]

[DOI]

Luiz Osvaldo Evangelista

Wagner Meira Jr.

J. Inf. Data Manag., 2010

Using structural information to improve search in Web collections.

[BibT_eX]

[DOI]

J. Assoc. Inf. Sci. Technol., 2010

Information Systems Special Issue on SBBD 2007.

[BibT_eX]

[DOI]

Inf. Syst., 2010

Exploring features for the automatic identification of user goals in web search.

[BibT_eX]

[DOI]

Mauro Rojas Herrera

Marco Cristo

Thomaz Philippe C. Silva

Inf. Process. Manag., 2010

A Self-Supervised Approach for Extraction of Attribute-Value Pairs from Wikipedia Articles.

[BibT_eX]

[DOI]

Wladmir C. Brandão

Proceedings of the String Processing and Information Retrieval, 2010

ONDUX: on-demand unsupervised learning for information extraction.

[BibT_eX]

[DOI]

Proceedings of the ACM SIGMOD International Conference on Management of Data, 2010

Automatically Generating Structured Queries in XML Keyword Search.

[BibT_eX]

[DOI]

Felipe da C. Hummel

Mirella M. Moro

Proceedings of the Comparative Evaluation of Focused Retrieval, 2010

Active Learning Genetic programming for record deduplication.

[BibT_eX]

[DOI]

Junio de Freitas

Gisele L. Pappa

Adriano Veloso

André Luiz da Costa Carvalho

Proceedings of the IEEE Congress on Evolutionary Computation, 2010

2009

On Finding Templates on Web Collections.

[BibT_eX]

[DOI]

Karane Vieira

Klessius Berlt

World Wide Web, 2009

A Genre-Aware Approach to Focused Crawling.

[BibT_eX]

[DOI]

Guilherme T. de Assis

World Wide Web, 2009

A flexible approach for extracting metadata from bibliographic citations.

[BibT_eX]

[DOI]

J. Assoc. Inf. Sci. Technol., 2009

An evolutionary approach for combining different sources of evidence in search engines.

[BibT_eX]

[DOI]

Thomaz Philippe C. Silva

Inf. Syst., 2009

A strategy for allowing meaningful and comparable scores in approximate matching.

[BibT_eX]

[DOI]

Carina F. Dorneles

Marcos Freitas Nunes

Viviane Pereira Moreira

Inf. Syst., 2009

Automatically filling form-based web interfaces with free text inputs.

[BibT_eX]

[DOI]

Guilherme A. Toda

Marden S. Neubert

Proceedings of the 18th International Conference on World Wide Web, 2009

Blocagem Adaptativa e Flexível para o Pareamento Aproximado de Registros.

[BibT_eX]

[DOI]

Luiz Osvaldo Evangelista

Wagner Meira Jr.

Proceedings of the XXIV Simpósio Brasileiro de Banco de Dados, 2009

2008

Locality-Based pruning methods for web search.

[BibT_eX]

[DOI]

Célia Francisca dos Santos

Bruno Dos Santos de Araujo

Mario A. Nascimento

ACM Trans. Inf. Syst., 2008

Structure-Based Crawling in the Hidden Web.

[BibT_eX]

[DOI]

Márcio L. A. Vidal

J. Univers. Comput. Sci., 2008

Replica identification using genetic programming.

[BibT_eX]

[DOI]

Proceedings of the 2008 ACM Symposium on Applied Computing (SAC), 2008

The impact of term selection in genre-aware focused crawling.

[BibT_eX]

[DOI]

Guilherme T. de Assis

Proceedings of the 2008 ACM Symposium on Applied Computing (SAC), 2008

Cooperative Research on Web Data Management at UFMG and UFAM - A Brief Report.

[BibT_eX]

[DOI]

Proceedings of the Latin American Web Conference, 2008

Siphon++: a hidden-webcrawler for keyword-based interfaces.

[BibT_eX]

[DOI]

Karane Vieira

Luciano Barbosa

Proceedings of the 17th ACM Conference on Information and Knowledge Management, 2008

2007

LABRADOR: Efficiently publishing relational databases on the web by using keyword-based query interfaces.

[BibT_eX]

[DOI]

André Luiz da Costa Carvalho

Inf. Process. Manag., 2007

A cost-effective method for detecting web site replicas on search engine databases.

[BibT_eX]

[DOI]

Allan José de Souza Bezerra

Klessius Berlt

Data Knowl. Eng., 2007

An approach to XML path matching.

[BibT_eX]

[DOI]

Alexander R. Vinson

Proceedings of the 9th ACM International Workshop on Web Information and Data Management (WIDM 2007), 2007

FleDEx: flexible data exchange.

[BibT_eX]

[DOI]

Denilson Barbosa

Proceedings of the 9th ACM International Workshop on Web Information and Data Management (WIDM 2007), 2007

Exploiting Genre in Focused Crawling.

[BibT_eX]

[DOI]

Guilherme T. de Assis

Dorgival Olavo Guedes Neto

Proceedings of the String Processing and Information Retrieval, 2007

A Scalable Parallel Deduplication Algorithm.

[BibT_eX]

[DOI]

Proceedings of the 19th Symposium on Computer Architecture and High Performance Computing (SBAC-PAD 2007), 2007

Labeling Data Extracted from the Web.

[BibT_eX]

[DOI]

Denilson Barbosa

Marco A. S. Sevalho

Proceedings of the On the Move to Meaningful Internet Systems 2007: CoopIS, 2007

FLUX-CIM: flexible unsupervised extraction of citation metadata.

[BibT_eX]

[DOI]

Proceedings of the ACM/IEEE Joint Conference on Digital Libraries, 2007

Organizing Hidden-Web Databases by Clustering Visible Web Documents.

[BibT_eX]

[DOI]

Luciano Barbosa

Proceedings of the 23rd International Conference on Data Engineering, 2007

Computing block importance for searching on web sites.

[BibT_eX]

[DOI]

Proceedings of the Sixteenth ACM Conference on Information and Knowledge Management, 2007

A strategy for allowing meaningful and comparable scores in approximate matching.

[BibT_eX]

[DOI]

Carina F. Dorneles

Viviane Moreira Orengo

Proceedings of the Sixteenth ACM Conference on Information and Knowledge Management, 2007

2006

GoGetIt!: a tool for generating structure-driven web crawlers.

[BibT_eX]

[DOI]

Márcio L. A. Vidal

Proceedings of the 15th international conference on World Wide Web, 2006

Structure-driven crawler generation by example.

[BibT_eX]

[DOI]

Márcio L. A. Vidal

Roberto Oliveira dos Santos

Proceedings of the SIGIR 2006: Proceedings of the 29th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, 2006

Extração de Dados e Metadados em Textos Semi-estruturados usando HMMs.

[BibT_eX]

[DOI]

Edson César Cunha de Oliveira

Eli Cortez C. Vilarinho

Proceedings of the XXI Simpósio Brasileiro de Banco de Dados, 2006

Extracting and Searching Useful Information Available on Web FAQs.

[BibT_eX]

[DOI]

Proceedings of the XXI Simpósio Brasileiro de Banco de Dados, 2006

Learning to deduplicate.

[BibT_eX]

[DOI]

Proceedings of the ACM/IEEE Joint Conference on Digital Libraries, 2006

A fast and robust method for web page template detection and removal.

[BibT_eX]

[DOI]

Karane Vieira

Nick Pinto

Proceedings of the 2006 ACM CIKM International Conference on Information and Knowledge Management, 2006

2005

Improving Web search efficiency via a locality based static pruning method.

[BibT_eX]

[DOI]

Célia Francisca dos Santos

Daniel R. Fernandes

André Luiz da Costa Carvalho

Mario A. Nascimento

Proceedings of the 14th international conference on World Wide Web, 2005

Detecção de Réplicas Utilizando Conteúdo e Estrutura.

[BibT_eX]

[DOI]

Allan José de Souza Bezerra

Patrícia Silva Peres

Proceedings of the 20° Simpósio Brasileiro de Bancos de Dados, 2005

Integrating Web Data and Geographic Knowledge into Spatial Databases.

[BibT_eX]

Karla A. V. Borges

Joyce C. P. Carvalho

Claudia Bauzer Medeiros

Clodoveu A. Davis Jr.

Proceedings of the Spatial Databases: Technologies, Techniques and Trends, 2005

2004

A Bayesian network approach to searching Web databases through keyword-based queries.

[BibT_eX]

[DOI]

Inf. Process. Manag., 2004

Automatic generation of agents for collecting hidden Web pages for data extraction.

[BibT_eX]

[DOI]

Data Knowl. Eng., 2004

Automatic web news extraction using tree edit distance.

[BibT_eX]

[DOI]

Proceedings of the 13th international conference on World Wide Web, 2004

Measuring similarity between collection of values.

[BibT_eX]

[DOI]

Carina F. Dorneles

Andrei E. N. Lima

Proceedings of the Sixth ACM CIKM International Workshop on Web Information and Data Management (WIDM 2004), 2004

The effectiveness of automatically structured queries in digital libraries.

[BibT_eX]

[DOI]

Edward A. Fox

Aaron Krowne

Proceedings of the ACM/IEEE Joint Conference on Digital Libraries, 2004

Information Retrieval Aware Web Site Modelling and Generation.

[BibT_eX]

[DOI]

Keyla Ahnizeret

Proceedings of the Conceptual Modeling, 2004

2003

Finding similar identities among objects from multiple web sources.

[BibT_eX]

[DOI]

Joyce C. P. Carvalho

Olga Regina Fradico de Oliveira

Proceedings of the Fifth ACM CIKM International Workshop on Web Information and Data Management (WIDM 2003), 2003

Verificação Automática da Qualidade de Dados Extraídos da Web.

[BibT_eX]

Proceedings of the XVIII Simpósio Brasileiro de Bancos de Dados, 2003

The Web-DL Environment for Building Digital Libraries from the Web.

[BibT_eX]

[DOI]

Edward A. Fox

Pablo A. Roberto

Monique V. Vieira

Proceedings of the ACM/IEEE 2003 Joint Conference on Digital Libraries (JCDL 2003), 2003

The Web as a Data Source for Spatial Databases.

[BibT_eX]

Karla A. V. Borges

Claudia Bauzer Medeiros

Clodoveu A. Davis Jr.

Proceedings of the Anais GEOINFO 2003, 2003

Keyword-Based Queries Over Web Databases.

[BibT_eX]

Proceedings of the Effective Databases for Text & Document Management., 2003

2002

Estratégias baseadas em exemplos para extração de dados semi-estruturados da web.

[BibT_eX]

[DOI]

PhD thesis, 2002

A Brief Survey of Web Data Extraction Tools.

[BibT_eX]

[DOI]

Juliana S. Teixeira

SIGMOD Rec., 2002

The Debye Environment for Web Data Management.

[BibT_eX]

[DOI]

Karine V. Magalhães

IEEE Internet Comput., 2002

DEByE - Data Extraction By Example.

[BibT_eX]

[DOI]

Data Knowl. Eng., 2002

Collecting hidden web pages for data extraction.

[BibT_eX]

[DOI]

Proceedings of the Fourth ACM CIKM International Workshop on Web Information and Data Management (WIDM 2002), 2002

A Framework for Generating Attribute Extractors for Web Data Sources.

[BibT_eX]

[DOI]

Robson Braga Araújo

Proceedings of the String Processing and Information Retrieval, 2002

Consultando Bancos de Dados Disponíveis na Web Usando Palavras-Chave.

[BibT_eX]

Proceedings of the XVII Simpósio Brasileiro de Banco de Dados, 2002

Structuring keyword-based queries for web databases.

[BibT_eX]

[DOI]

Proceedings of the ACM/IEEE Joint Conference on Digital Libraries, 2002

Representing and Querying Semistructured Web Data Using Nested Tables with Structural Variants.

[BibT_eX]

[DOI]

David W. Embley

Proceedings of the Conceptual Modeling, 2002

Searching web databases by structuring keyword-based queries.

[BibT_eX]

[DOI]

Proceedings of the 2002 ACM CIKM International Conference on Information and Knowledge Management, 2002

Web-DL: an experience in building digital libraries from the web.

[BibT_eX]

[DOI]

Pablo A. Roberto

Monique V. Vieira

Edward A. Fox

Proceedings of the 2002 ACM CIKM International Conference on Information and Knowledge Management, 2002

Using Nested Tables for Representing and Querying Semistructured Web Data.

[BibT_eX]

[DOI]

David W. Embley

Proceedings of the Advanced Information Systems Engineering, 14th International Conference, 2002

2001

Querying Semistructured Data By Example: The QSByE Interface.

[BibT_eX]

Proceedings of the International Workshop on Information Integration on the Web, 2001

An Environment for Building and Maintaining Web Views.

[BibT_eX]

Alisson R. Arantes

Proceedings of the International Workshop on Information Integration on the Web, 2001

Storing Semistructured Data in Relational Databases.

[BibT_eX]

[DOI]

Karine V. Magalhães

Proceedings of the Eighth International Symposium on String Processing and Information Retrieval, 2001

Uma Abordagem para Armazenamento de Dados Semi-Estruturados em Bancos de Dados Relacionais.

[BibT_eX]

Karine V. Magalhães

Proceedings of the XVI Simpósio Brasileiro de Banco de Dados, 2001

Managing Web Data through Views.

[BibT_eX]

[DOI]

Alisson R. Arantes

Proceedings of the Electronic Commerce and Web Technologies, 2001

Bootstrapping for Example-Based Data Extraction.

[BibT_eX]

[DOI]

Proceedings of the 2001 ACM CIKM International Conference on Information and Knowledge Management, 2001

2000

On the relational representation of complex specialization structures.

[BibT_eX]

[DOI]

Marco A. Casanova

Inf. Syst., 2000

Uma Interface Gráfica para Consulta a Fontes de Dados XML.

[BibT_eX]

Karine de Góes Louly

Tatiana A. S. Coelho

Proceedings of the XV Simpósio Brasileiro de Banco de Dados, 2000

ASByE: uma Ferramenta Baseada em Exemplos para Especificação de Agentes para Coleta de Documentos Web.

[BibT_eX]

Proceedings of the XV Simpósio Brasileiro de Banco de Dados, 2000

An Example-Based Environment for Wrapper Generation.

[BibT_eX]

[DOI]

Proceedings of the Conceptual Modeling for E-Business and the Web, 2000

Representing Web Data as Complex Objects.

[BibT_eX]

[DOI]

Elaine S. Silva

Proceedings of the Electronic Commerce and Web Technologies, 2000

1999

CoBWeb - A Crawler for the Brazilian Web.

[BibT_eX]

[DOI]

Eveline A. Veloso

Proceedings of the Sixth International Symposium on String Processing and Information Retrieval and Fifth International Workshop on Groupware, 1999

Top-down Extraction of Semi-Structured Data.

[BibT_eX]

[DOI]

Proceedings of the Sixth International Symposium on String Processing and Information Retrieval and Fifth International Workshop on Groupware, 1999

DEByE - Uma ferramenta para Extração de Dados Semi-Estruturados.

[BibT_eX]

Elaine S. Silva

Proceedings of the XIV Simpósio Brasileiro de Banco de Dados, 1999

Extracting Semi-Structured Data Through Examples.

[BibT_eX]

[DOI]

Proceedings of the 1999 ACM CIKM International Conference on Information and Knowledge Management, 1999

1996

An Approach to Maintaining Optimized Relational Representations of Entity-Relationship Schemas.

[BibT_eX]

[DOI]