Venkatesh Ganti

Proceedings of the Encyclopedia of Database Systems, Second Edition, 2018

2013

Data Cleaning: A Practical Perspective

[BibT_eX]

[DOI]

Anish Das Sarma

Synthesis Lectures on Data Management, Morgan & Claypool Publishers, ISBN: 978-3-031-01897-8, 2013

Crawling deep web entity pages.

[BibT_eX]

[DOI]

Proceedings of the Sixth ACM International Conference on Web Search and Data Mining, 2013

2011

Interval-based pruning for top-k processing over compressed lists.

[BibT_eX]

[DOI]

Kaushik Chakrabarti

Proceedings of the 27th International Conference on Data Engineering, 2011

2010

Keyword++: A Framework to Improve Keyword Search Over Entity Databases.

[BibT_eX]

[DOI]

Dong Xin

Yeye He

Proc. VLDB Endow., 2010

Precomputing search features for fast and accurate query classification.

[BibT_eX]

[DOI]

Arnd Christian König

Xiao Li

Proceedings of the Third International Conference on Web Search and Web Data Mining, 2010

Query portals: dynamically generating portals for entity-oriented web queries.

[BibT_eX]

[DOI]

Proceedings of the ACM SIGMOD International Conference on Management of Data, 2010

2009

Data Cleaning.

[BibT_eX]

[DOI]

Proceedings of the Encyclopedia of Database Systems, 2009

Mining Document Collections to Facilitate Accurate Approximate Entity Matching.

[BibT_eX]

[DOI]

Dong Xin

Proc. VLDB Endow., 2009

Exploiting web search to generate synonyms for entities.

[BibT_eX]

[DOI]

Dong Xin

Proceedings of the 18th International Conference on World Wide Web, 2009

Exploiting web search engines to search structured databases.

[BibT_eX]

[DOI]

Proceedings of the 18th International Conference on World Wide Web, 2009

2008

Scalable ad-hoc entity extraction from text collections.

[BibT_eX]

[DOI]

Proc. VLDB Endow., 2008

An efficient filter for approximate membership checking.

[BibT_eX]

[DOI]

Proceedings of the ACM SIGMOD International Conference on Management of Data, 2008

Entity categorization over large document collections.

[BibT_eX]

[DOI]

Arnd Christian König

Rares Vernica

Proceedings of the 14th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 2008

2007

Example-driven design of efficient record matching queries.

[BibT_eX]

[DOI]

Proceedings of the 33rd International Conference on Very Large Data Bases, 2007

Leveraging aggregate constraints for deduplication.

[BibT_eX]

[DOI]

Proceedings of the ACM SIGMOD International Conference on Management of Data, 2007

2006

Data Debugger: An Operator-Centric Approach for Data Quality Solutions.

[BibT_eX]

[DOI]

Raghav Kaushik

IEEE Data Eng. Bull., 2006

Efficient Exact Set-Similarity Joins.

[BibT_eX]

[DOI]

Arvind Arasu

Raghav Kaushik

Proceedings of the 32nd International Conference on Very Large Data Bases, 2006

Ranking objects based on relationships.

[BibT_eX]

[DOI]

Proceedings of the ACM SIGMOD International Conference on Management of Data, 2006

A Primitive Operator for Similarity Joins in Data Cleaning.

[BibT_eX]

[DOI]

Raghav Kaushik

Proceedings of the 22nd International Conference on Data Engineering, 2006

2005

Data cleaning in microsoft SQL server 2005.

[BibT_eX]

[DOI]

Proceedings of the ACM SIGMOD International Conference on Management of Data, 2005

Robust Identification of Fuzzy Duplicates.

[BibT_eX]

[DOI]

Rajeev Motwani

Proceedings of the 21st International Conference on Data Engineering, 2005

2004

Data management technology for decision support systems.

[BibT_eX]

[DOI]

Umeshwar Dayal

Adv. Comput., 2004

Mining reference tables for automatic text segmentation.

[BibT_eX]

[DOI]

Eugene Agichtein

Proceedings of the Tenth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 2004

Selectivity Estimation for String Predicates: Overcoming the Underestimation Problem.

[BibT_eX]

[DOI]

Luis Gravano

Proceedings of the 20th International Conference on Data Engineering, 2004

2003

Robust and Efficient Fuzzy Match for Online Data Cleaning.

[BibT_eX]

[DOI]

Proceedings of the 2003 ACM SIGMOD International Conference on Management of Data, 2003

2002

Mining Data Streams under Block Evolution.

[BibT_eX]

[DOI]

SIGKDD Explor., 2002

A Framework for Measuring Differences in Data Characteristics.

[BibT_eX]

[DOI]

J. Comput. Syst. Sci., 2002

Eliminating Fuzzy Duplicates in Data Warehouses.

[BibT_eX]

[DOI]

Rohit Ananthakrishna

Proceedings of 28th International Conference on Very Large Data Bases, 2002

2001

Database Technology for Decision Support Systems.

[BibT_eX]

[DOI]

Umeshwar Dayal

Computer, 2001

2000

ICICLES: Self-Tuning Samples for Approximate Query Answering.

[BibT_eX]

[DOI]

Mong-Li Lee

Proceedings of the VLDB 2000, 2000

DEMON: Mining and Monitoring Evolving Data.

[BibT_eX]

[DOI]

Proceedings of the 16th International Conference on Data Engineering, San Diego, California, USA, February 28, 2000

1999

Approximate Query Answering using Histograms.

[BibT_eX]

[DOI]

Viswanath Poosala

Yannis E. Ioannidis

IEEE Data Eng. Bull., 1999

Mining Very Large Databases.

[BibT_eX]

[DOI]

Computer, 1999

Fast Approximate Answers to Aggregate Queries on a Data Cube.

[BibT_eX]

[DOI]

Viswanath Poosala

Proceedings of the 11th International Conference on Scientific and Statistical Database Management, 1999

BOAT-Optimistic Decision Tree Construction.

[BibT_eX]

[DOI]

Proceedings of the SIGMOD 1999, 1999

A Framework for Measuring Changes in Data Characteristics.

[BibT_eX]

[DOI]

Proceedings of the Eighteenth ACM SIGACT-SIGMOD-SIGART Symposium on Principles of Database Systems, May 31, 1999

CACTUS - Clustering Categorical Data Using Summaries.

[BibT_eX]

[DOI]

Proceedings of the Fifth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 1999

Fast Approximate Query Answering Using Precomputed Statistics.

[BibT_eX]

[DOI]

Viswanath Poosala

Proceedings of the 15th International Conference on Data Engineering, 1999

Clustering Large Datasets in Arbitrary Metric Spaces.

[BibT_eX]

[DOI]

Proceedings of the 15th International Conference on Data Engineering, 1999

1998

RainForest - A Framework for Fast Decision Tree Construction of Large Datasets.

[BibT_eX]

[DOI]