Yahong Han

CoRR, May, 2026

PaveBench: A Versatile Benchmark for Pavement Distress Perception and Interactive Vision-Language Analysis.

[BibT_eX]

[DOI]

CoRR, April, 2026

VGGDrive: Empowering Vision-Language Models with Cross-View Geometric Grounding for Autonomous Driving.

[BibT_eX]

[DOI]

CoRR, February, 2026

Towards Open Environments and Instructions: General Vision-Language Navigation via Fast-Slow Interactive Reasoning.

[BibT_eX]

[DOI]

CoRR, January, 2026

Fourier-KAN: Feature Distribution Decomposition and Recombination for Unknown-Domain Object Detection.

[BibT_eX]

[DOI]

IEEE Trans. Image Process., 2026

Enhanced visual prompt meets low-light saliency detection.

[BibT_eX]

[DOI]

Nana Yu

Jie Wang

Pattern Recognit., 2026

Simulating Distribution Dynamics: Liquid Temporal Feature Evolution for Single-Domain Generalized Object Detection.

[BibT_eX]

[DOI]

Proceedings of the Fortieth AAAI Conference on Artificial Intelligence, 2026

2025

Latent Factor Modeling With Expert Network for Multi-Behavior Recommendation.

[BibT_eX]

[DOI]

IEEE Trans. Knowl. Data Eng., October, 2025

A Static-Dynamic Composition Framework for Efficient Action Recognition.

[BibT_eX]

[DOI]

IEEE Trans. Neural Networks Learn. Syst., August, 2025

User Invariant Preference Learning for Multi-Behavior Recommendation.

[BibT_eX]

[DOI]

ACM Trans. Inf. Syst., July, 2025

Semantic Prompt Enhancement for Semi-Supervised Low-Light Salient Object Detection.

[BibT_eX]

[DOI]

IEEE Trans. Neural Networks Learn. Syst., June, 2025

Dynamic prototype-guided structural information maintaining for unsupervised domain adaptation.

[BibT_eX]

[DOI]

Pattern Anal. Appl., June, 2025

Prototype-guided cross-task knowledge distillation.

[BibT_eX]

[DOI]

Frontiers Inf. Technol. Electron. Eng., June, 2025

Single-Group Generalized RGB and RGB-D Co-Salient Object Detection.

[BibT_eX]

[DOI]

IEEE Trans. Circuits Syst. Video Technol., May, 2025

Explicitly Disentangling and Exclusively Fusing for Semi-Supervised Bi-Modal Salient Object Detection.

[BibT_eX]

[DOI]

IEEE Trans. Circuits Syst. Video Technol., May, 2025

A comprehensive survey of physical adversarial vulnerabilities in autonomous driving systems.

[BibT_eX]

[DOI]

Frontiers Inf. Technol. Electron. Eng., April, 2025

WiViPose: A Video-Aided Wi-Fi Framework for Environment-Independent 3D Human Pose Estimation.

[BibT_eX]

[DOI]

IEEE Trans. Multim., 2025

AdvNeRF: Generating 3D Adversarial Meshes With NeRF to Fool Driving Vehicles.

[BibT_eX]

[DOI]

IEEE Trans. Inf. Forensics Secur., 2025

Information disentanglement for unsupervised domain adaptive Oracle Bone Inscriptions detection.

[BibT_eX]

[DOI]

Signal Process. Image Commun., 2025

Progressive expansion for semi-supervised bi-modal salient object detection.

[BibT_eX]

[DOI]

Pattern Recognit., 2025

Robust source-free domain adaptation with anti-adversarial samples training.

[BibT_eX]

[DOI]

Zhirui Wang

Liu Yang

Neurocomputing, 2025

Adaptive integrated weight unsupervised multi-source domain adaptation without source data.

[BibT_eX]

[DOI]

Zhirui Wang

Liu Yang

Complex Intell. Syst., 2025

Novel Class Discovery for Point Cloud Segmentation via Joint Learning of Causal Representation and Reasoning.

[BibT_eX]

[DOI]

Proceedings of the Advances in Neural Information Processing Systems 38: Annual Conference on Neural Information Processing Systems 2025, 2025

Ex Pede Herculem, Predicting Global Actionness Curve from Local Clips.

[BibT_eX]

[DOI]

Proceedings of the 33rd ACM International Conference on Multimedia, 2025

Object-Centric Feature Enrichment for Single-Domain Generalized Object Detection.

[BibT_eX]

[DOI]

Shukuan Yuan

Zihao Zhang

Proceedings of the IEEE International Conference on Multimedia and Expo, 2025

LBA: Multi-Scale Video Segment Sampling for Open-Ended Video Question Answering.

[BibT_eX]

[DOI]

Jin Wang

Proceedings of the Advanced Intelligent Computing Technology and Applications, 2025

Unknown Text Learning for Clip-Based Few-Shot Open-Set Recognition.

[BibT_eX]

[DOI]

Proceedings of the IEEE/CVF International Conference on Computer Vision, 2025

Continual Adaptation: Environment-Conditional Parameter Generation for Object Detection in Dynamic Scenarios.

[BibT_eX]

[DOI]

Proceedings of the IEEE/CVF International Conference on Computer Vision, 2025

Coupling the Generator with Teacher for Effective Data-Free Knowledge Distillation.

[BibT_eX]

[DOI]

Proceedings of the IEEE/CVF International Conference on Computer Vision, 2025

Process Adaptive Learning for Visual-Language Navigation.

[BibT_eX]

[DOI]

Chaoqi Gao

Boyuan Zhang

Proceedings of the Artificial Neural Networks and Machine Learning - ICANN 2025, 2025

Style Evolving along Chain-of-Thought for Unknown-Domain Object Detection.

[BibT_eX]

[DOI]

Zihao Zhang

Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2025

Visual Consensus Prompting for Co-Salient Object Detection.

[BibT_eX]

[DOI]

Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2025

2024

Camouflaged Object Segmentation Based on Matching-Recognition-Refinement Network.

[BibT_eX]

[DOI]

IEEE Trans. Neural Networks Learn. Syst., November, 2024

Linking unknown characters via oracle bone inscriptions retrieval.

[BibT_eX]

[DOI]

Multim. Syst., June, 2024

ATRA: Efficient adversarial training with high-robust area.

[BibT_eX]

[DOI]

Shibin Liu

Vis. Comput., May, 2024

Cascade & allocate: A cross-structure adversarial attack against models fusing vision and language.

[BibT_eX]

[DOI]

Inf. Fusion, April, 2024

Oracle bone fragment image dataset.

[BibT_eX]

[DOI]

Dataset, March, 2024

Joint Correcting and Refinement for Balanced Low-Light Image Enhancement.

[BibT_eX]

[DOI]

Nana Yu

Hong Shi

IEEE Trans. Multim., 2024

Generalizing to Out-of-Sample Degradations via Model Reprogramming.

[BibT_eX]

[DOI]

Runhua Jiang

IEEE Trans. Image Process., 2024

Weakly-Supervised Video Anomaly Detection With Snippet Anomalous Attention.

[BibT_eX]

[DOI]

IEEE Trans. Circuits Syst. Video Technol., 2024

Pseudo-label refinement via hierarchical contrastive learning for source-free unsupervised domain adaptation.

[BibT_eX]

[DOI]

Pattern Recognit. Lett., 2024

Degradation-removed multiscale fusion for low-light salient object detection.

[BibT_eX]

[DOI]

Pattern Recognit., 2024

VADS: Visuo-Adaptive DualStrike attack on visual question answer.

[BibT_eX]

[DOI]

Comput. Vis. Image Underst., 2024

Human-Like Code Quality Evaluation through LLM-based Recursive Semantic Comprehension.

[BibT_eX]

[DOI]

CoRR, 2024

Behavior-Contextualized Item Preference Modeling for Multi-Behavior Recommendation.

[BibT_eX]

[DOI]

Proceedings of the 47th International ACM SIGIR Conference on Research and Development in Information Retrieval, 2024

Decompositional Semantic Analysis for LLM-based Code Quality Evaluation.

[BibT_eX]

[DOI]

Proceedings of the ISWC 2024 Posters, 2024

Oracle Character Prototype-Guided Cyclic Disentanglement for Oracle Bone Inscriptions Detection.

[BibT_eX]

[DOI]

Proceedings of the Pattern Recognition and Artificial Intelligence, 2024

Improving Transferability of Adversarial Examples with Adversaries Competition.

[BibT_eX]

[DOI]

Proceedings of the IEEE International Conference on Multimedia and Expo, 2024

A Patch-wise Adversarial Denoising Could Enhance the Robustness of Adversarial Training.

[BibT_eX]

[DOI]

Proceedings of the IEEE International Conference on Multimedia and Expo, 2024

Symmetrical Two-Stream with Selective Sampling for Diversifying Video Captions.

[BibT_eX]

[DOI]

Jin Wang

Proceedings of the IEEE International Conference on Multimedia and Expo, 2024

Prompt-Driven Dynamic Object-Centric Learning for Single Domain Generalization.

[BibT_eX]

[DOI]

Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2024

Multi-Source Collaborative Gradient Discrepancy Minimization for Federated Domain Generalization.

[BibT_eX]

[DOI]

Yikang Wei

Proceedings of the Thirty-Eighth AAAI Conference on Artificial Intelligence, 2024

2023

Improving transferable adversarial attack for vision transformers via global attention and local drop.

[BibT_eX]

[DOI]

Tuo Li

Multim. Syst., December, 2023

Source-free and black-box domain adaptation via distributionally adversarial training.

[BibT_eX]

[DOI]

Pattern Recognit., November, 2023

Dynamic parameterized learning for unsupervised domain adaptation.

[BibT_eX]

[DOI]

Runhua Jiang

Frontiers Inf. Technol. Electron. Eng., November, 2023

Weakly supervised anomaly detection with multi-level contextual modeling.

[BibT_eX]

[DOI]

Multim. Syst., August, 2023

Domain-specific feature elimination: multi-source domain adaptation for image classification.

[BibT_eX]

[DOI]

Kunhong Wu

Fan Jia

Frontiers Comput. Sci., August, 2023

Multi-Source Collaborative Contrastive Learning for Decentralized Domain Adaptation.

[BibT_eX]

[DOI]

IEEE Trans. Circuits Syst. Video Technol., May, 2023

Active and Compact Entropy Search for High-Dimensional Bayesian Optimization.

[BibT_eX]

[DOI]

IEEE Trans. Knowl. Data Eng., 2023

Query-Efficient Black-Box Adversarial Attack With Customized Iteration and Sampling.

[BibT_eX]

[DOI]

IEEE Trans. Pattern Anal. Mach. Intell., 2023

Weighted progressive alignment for multi-source domain adaptation.

[BibT_eX]

[DOI]

Kunhong Wu

Liang Li

Multim. Syst., 2023

Joint Correcting and Refinement for Balanced Low-Light Image Enhancement.

[BibT_eX]

[DOI]

CoRR, 2023

A Cross-modal and Redundancy-reduced Network for Weakly-Supervised Audio-Visual Violence Detection.

[BibT_eX]

[DOI]

Proceedings of the ACM Multimedia Asia 2023, 2023

Saliency Prototype for RGB-D and RGB-T Salient Object Detection.

[BibT_eX]

[DOI]

Zihao Zhang

Jie Wang

Proceedings of the 31st ACM International Conference on Multimedia, 2023

OraclePoints: A Hybrid Neural Representation for Oracle Character.

[BibT_eX]

[DOI]

Proceedings of the 31st ACM International Conference on Multimedia, 2023

Uncertainty-Aware Variate Decomposition for Self-supervised Blind Image Deblurring.

[BibT_eX]

[DOI]

Runhua Jiang

Proceedings of the 31st ACM International Conference on Multimedia, 2023

Discriminative and Contrastive Consistency for Semi-supervised Domain Adaptive Image Classification.

[BibT_eX]

[DOI]

Yidan Fan

Wenhuan Lu

Proceedings of the IEEE International Conference on Multimedia and Expo, 2023

Exploring Instance Relation for Decentralized Multi-Source Domain Adaptation.

[BibT_eX]

[DOI]

Yikang Wei

Proceedings of the IEEE International Conference on Acoustics, 2023

Reliable and Interpretable Personalized Federated Learning.

[BibT_eX]

[DOI]

Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2023

2022

Curiosity-Driven Salient Object Detection With Fragment Attention.

[BibT_eX]

[DOI]

IEEE Trans. Image Process., 2022

Action Keypoint Network for Efficient Video Recognition.

[BibT_eX]

[DOI]

IEEE Trans. Image Process., 2022

Image Translation for Oracle Bone Character Interpretation.

[BibT_eX]

[DOI]

Symmetry, 2022

Effective full-scale detection for salient object based on condensing-and-filtering network.

[BibT_eX]

[DOI]

Pattern Recognit., 2022

Instance-Invariant Domain Adaptive Object Detection Via Progressive Disentanglement.

[BibT_eX]

[DOI]

IEEE Trans. Pattern Anal. Mach. Intell., 2022

Multi-attribute object detection benchmark for smart city.

[BibT_eX]

[DOI]

Multim. Syst., 2022

Complementary spatiotemporal network for video question answering.

[BibT_eX]

[DOI]

Xinrui Li

Multim. Syst., 2022

Dual collaboration for decentralized multi-source domain adaptation.

[BibT_eX]

[DOI]

Yikang Wei

Frontiers Inf. Technol. Electron. Eng., 2022

Exploring uncertainty in regression neural networks for construction of prediction intervals.

[BibT_eX]

[DOI]

Neurocomputing, 2022

Instance-sequence reasoning for video question answering.

[BibT_eX]

[DOI]

Rui Liu

Frontiers Comput. Sci., 2022

Unidirectional RGB-T salient object detection with intertwined driving of encoding and fusion.

[BibT_eX]

[DOI]

Eng. Appl. Artif. Intell., 2022

Prototype-guided Cross-task Knowledge Distillation for Large-scale Models.

[BibT_eX]

[DOI]

CoRR, 2022

Peng Cheng Object Detection Benchmark for Smart City.

[BibT_eX]

[DOI]

CoRR, 2022

Decision-based Black-box Attack Against Vision Transformers via Patch-wise Adversarial Removal.

[BibT_eX]

[DOI]

Proceedings of the Advances in Neural Information Processing Systems 35: Annual Conference on Neural Information Processing Systems 2022, 2022

Multi-Granularity Semantic Clues Extraction for Video Question Answering.

[BibT_eX]

[DOI]

Fei Zhou

Proceedings of the IEEE International Conference on Multimedia and Expo, 2022

Mining Valuable Source Domain Instances for Privacy-Preserving Domain Adaptive Object Detection.

[BibT_eX]

[DOI]

Jian Liu

Jianqiao An

Proceedings of the IEEE International Conference on Multimedia and Expo, 2022

Hierarchical Recurrent Contextual Attention Network for Video Question Answering.

[BibT_eX]

[DOI]

Fei Zhou

Proceedings of the Artificial Intelligence - Second CAAI International Conference, 2022

Maintaining Structural Information by Pairwise Similarity for Unsupervised Domain Adaptation.

[BibT_eX]

[DOI]

Jian Liu

Proceedings of the Artificial Intelligence - Second CAAI International Conference, 2022

Logic Rule Guided Attribution with Dynamic Ablation.

[BibT_eX]

[DOI]

Jianqiao An

Proceedings of the Thirty-Sixth AAAI Conference on Artificial Intelligence, 2022

2021

Hierarchical Memory Decoder for Visual Narrating.

[BibT_eX]

[DOI]

IEEE Trans. Circuits Syst. Video Technol., 2021

Deep multi-scale and multi-modal fusion for 3D object detection.

[BibT_eX]

[DOI]

Rui Guo

Deng Li

Pattern Recognit. Lett., 2021

An Evolutionary-Based Black-Box Attack to Deep Neural Network Classifiers.

[BibT_eX]

[DOI]

Mob. Networks Appl., 2021

Visual commonsense reasoning with directional visual connections.

[BibT_eX]

[DOI]

Frontiers Inf. Technol. Electron. Eng., 2021

Black-box Probe for Unsupervised Domain Adaptation without Model Transferring.

[BibT_eX]

[DOI]

CoRR, 2021

Anomaly Detection with Prototype-Guided Discriminative Latent Embeddings.

[BibT_eX]

[DOI]

CoRR, 2021

Exploring Uncertainty in Deep Learning for Construction of Prediction Intervals.

[BibT_eX]

[DOI]

CoRR, 2021

Universal-Prototype Augmentation for Few-Shot Object Detection.

[BibT_eX]

[DOI]

CoRR, 2021

Locating Visual Explanations for Video Question Answering.

[BibT_eX]

[DOI]

Proceedings of the MultiMedia Modeling - 27th International Conference, 2021

WAB'21: 1st Workshop on Multimodal Product Identification in Livestreaming and WAB Challenge.

[BibT_eX]

[DOI]

Proceedings of the MM '21: ACM Multimedia Conference, Virtual Event, China, October 20, 2021

Video-to-Image Casting: A Flatting Method for Video Analysis.

[BibT_eX]

[DOI]

Proceedings of the MM '21: ACM Multimedia Conference, Virtual Event, China, October 20, 2021

Graph-in-Graph Contrastive Learning for Semi-Supervised Adaptation.

[BibT_eX]

[DOI]

Liang Li

Proceedings of the 2021 IEEE International Conference on Multimedia and Expo, 2021

Zero Knowledge Adversarial Defense Via Iterative Translation Cycle.

[BibT_eX]

[DOI]

Fan Jia

Proceedings of the 2021 IEEE International Conference on Multimedia and Expo, 2021

Free Adversarial Training with Layerwise Heuristic Learning.

[BibT_eX]

[DOI]

Proceedings of the Image and Graphics - 11th International Conference, 2021

Adversarial Attack with KD-Tree Searching on Training Set.

[BibT_eX]

[DOI]

Proceedings of the Image and Graphics - 11th International Conference, 2021

Anomaly Detection with Prototype-Guided Discriminative Latent Embeddings.

[BibT_eX]

[DOI]

Yaowei Wang

Proceedings of the IEEE International Conference on Data Mining, 2021

Vector-Decomposed Disentanglement for Domain-Invariant Object Detection.

[BibT_eX]

[DOI]

Proceedings of the 2021 IEEE/CVF International Conference on Computer Vision, 2021

Universal-Prototype Enhancing for Few-Shot Object Detection.

[BibT_eX]

[DOI]

Proceedings of the 2021 IEEE/CVF International Conference on Computer Vision, 2021

2020

Discern Depth Under Foul Weather: Estimate PM<sub>2.5</sub> for Depth Inference.

[BibT_eX]

[DOI]

IEEE Trans. Ind. Informatics, 2020

Convolutional Reconstruction-to-Sequence for Video Captioning.

[BibT_eX]

[DOI]

IEEE Trans. Circuits Syst. Video Technol., 2020

Movie Question Answering via Textual Memory and Plot Graph.

[BibT_eX]

[DOI]

IEEE Trans. Circuits Syst. Video Technol., 2020

Sequence in sequence for video captioning.

[BibT_eX]

[DOI]

Huiyun Wang

Chongyang Gao

Pattern Recognit. Lett., 2020

Adaptive iterative attack towards explainable adversarial robustness.

[BibT_eX]

[DOI]

Pattern Recognit., 2020

Multi-Modal fusion with multi-level attention for Visual Dialog.

[BibT_eX]

[DOI]

Jingping Zhang

Qiang Wang

Inf. Process. Manag., 2020

Hierarchical Memory Decoding for Video Captioning.

[BibT_eX]

[DOI]

CoRR, 2020

Bidirectional Adversarial Training for Semi-Supervised Domain Adaptation.

[BibT_eX]

[DOI]

Proceedings of the Twenty-Ninth International Joint Conference on Artificial Intelligence, 2020

Two-Way Feature-Aligned And Attention-Rectified Adversarial Training.

[BibT_eX]

[DOI]

Proceedings of the IEEE International Conference on Multimedia and Expo, 2020

Video Anomaly Detection Via Predictive Autoencoder With Gradient-Based Attention.

[BibT_eX]

[DOI]

Rui Liu

Proceedings of the IEEE International Conference on Multimedia and Expo, 2020

Extract and Merge: Superpixel Segmentation with Regional Attributes.

[BibT_eX]

[DOI]

Proceedings of the Computer Vision - ECCV 2020, 2020

Polishing Decision-Based Adversarial Noise With a Customized Sampling.

[BibT_eX]

[DOI]

Qi Tian

Proceedings of the 2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2020

Multi-Speaker Video Dialog with Frame-Level Temporal Localization.

[BibT_eX]

[DOI]

Proceedings of the Thirty-Fourth AAAI Conference on Artificial Intelligence, 2020

Reasoning with Heterogeneous Graph Alignment for Video Question Answering.

[BibT_eX]

[DOI]

Pin Jiang

Proceedings of the Thirty-Fourth AAAI Conference on Artificial Intelligence, 2020

2019

Introduction to the Special Issue on the Cross-Media Analysis for Visual Question Answering.

[BibT_eX]

[DOI]

Richang Hong

Tat-Seng Chua

ACM Trans. Multim. Comput. Commun. Appl., 2019

Semisupervised Regression With Optimized Rank for Matrix Data Classification.

[BibT_eX]

[DOI]

IEEE Trans. Cybern., 2019

Image captioning: from structural tetrad to translated sentences.

[BibT_eX]

[DOI]

Rui Guo

Shubo Ma

Multim. Tools Appl., 2019

Multi-cue fusion: Discriminative enhancing for person re-identification.

[BibT_eX]

[DOI]

Yongge Liu

Nan Song

J. Vis. Commun. Image Represent., 2019

Detecting adversarial examples via prediction difference for deep neural networks.

[BibT_eX]

[DOI]

Inf. Sci., 2019

DCT-CNN-based classification method for the Gongbi and Xieyi techniques of Chinese ink-wash paintings.

[BibT_eX]

[DOI]

Neurocomputing, 2019

Capturing the spatio-temporal continuity for video semantic segmentation.

[BibT_eX]

[DOI]

Xin Chen

IET Image Process., 2019

A feature selection framework for video semantic recognition via integrated cross-media analysis and embedded learning.

[BibT_eX]

[DOI]

EURASIP J. Image Video Process., 2019

Convolutional Neural Network Style Transfer Towards Chinese Paintings.

[BibT_eX]

[DOI]

IEEE Access, 2019

Connective Cognition Network for Directional Visual Commonsense Reasoning.

[BibT_eX]

[DOI]

Proceedings of the Advances in Neural Information Processing Systems 32: Annual Conference on Neural Information Processing Systems 2019, 2019

Ranking Video Salient Object Detection.

[BibT_eX]

[DOI]

Proceedings of the 27th ACM International Conference on Multimedia, 2019

Hierarchical Variational Network for User-Diversified & Query-Focused Video Summarization.

[BibT_eX]

[DOI]

Pin Jiang

Proceedings of the 2019 on International Conference on Multimedia Retrieval, 2019

Video Interactive Captioning with Human Prompts.

[BibT_eX]

[DOI]

Proceedings of the Twenty-Eighth International Joint Conference on Artificial Intelligence, 2019

Untargeted Adversarial Attack via Expanding the Semantic Gap.

[BibT_eX]

[DOI]

Proceedings of the IEEE International Conference on Multimedia and Expo, 2019

Visual Dialog with Targeted Objects.

[BibT_eX]

[DOI]

Qiang Wang

Proceedings of the IEEE International Conference on Multimedia and Expo, 2019

Multi-Timescale Context Encoding for Scene Parsing Prediction.

[BibT_eX]

[DOI]

Xin Chen

Proceedings of the IEEE International Conference on Multimedia and Expo, 2019

3D Shape Retrieval through Multilayer RBF Neural Network.

[BibT_eX]

[DOI]

Guoyu Lu

Proceedings of the 2019 IEEE International Conference on Image Processing, 2019

Curls & Whey: Boosting Black-Box Adversarial Attacks.

[BibT_eX]

[DOI]

Siyu Wang

Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2019

Adaptive Sparse Confidence-Weighted Learning for Online Feature Selection.

[BibT_eX]

[DOI]

Proceedings of the Thirty-Third AAAI Conference on Artificial Intelligence, 2019

2018

Sequential Video VLAD: Training the Aggregation Locally and Temporally.

[BibT_eX]

[DOI]

IEEE Trans. Image Process., 2018

Pooling the Convolutional Layers in Deep ConvNets for Video Action Recognition.

[BibT_eX]

[DOI]

IEEE Trans. Circuits Syst. Video Technol., 2018

Distribution Sensitive Product Quantization.

[BibT_eX]

[DOI]

IEEE Trans. Circuits Syst. Video Technol., 2018

Discriminative multi-task multi-view feature selection and fusion for multimedia analysis.

[BibT_eX]

[DOI]

Multim. Tools Appl., 2018

Understanding the effective receptive field in semantic image segmentation.

[BibT_eX]

[DOI]

Yongge Liu

Jianzhuang Yu

Multim. Tools Appl., 2018

Guest Editorial: Spatio-temporal Feature Learning for Unconstrained Video Analysis.

[BibT_eX]

[DOI]

Liqiang Nie

Fei Wu

Multim. Tools Appl., 2018

Multi-task CNN Model for Action Detection.

[BibT_eX]

[DOI]

Xin Chen

Proceedings of the IEEE Visual Communications and Image Processing, 2018

Sequential Feature Fusion for Object Detection.

[BibT_eX]

[DOI]

Qiang Wang

Proceedings of the Advances in Multimedia Information Processing - PCM 2018, 2018

VAL: Visual-Attention Action Localizer.

[BibT_eX]

[DOI]

Xiaomeng Song

Proceedings of the Advances in Multimedia Information Processing - PCM 2018, 2018

Spotting and Aggregating Salient Regions for Video Captioning.

[BibT_eX]

[DOI]

Huiyun Wang

Youjiang Xu

Proceedings of the 2018 ACM Multimedia Conference on Multimedia Conference, 2018

Explore Multi-Step Reasoning in Video Question Answering.

[BibT_eX]

[DOI]

Proceedings of the 2018 ACM Multimedia Conference on Multimedia Conference, 2018

HeterStyle: A Heterogeneous Video Style Transfer Application.

[BibT_eX]

[DOI]

Proceedings of the 2018 ACM Multimedia Conference on Multimedia Conference, 2018

Explore Multi-Step Reasoning in Video Question Answering.

[BibT_eX]

[DOI]

Proceedings of the 1st Workshop and Challenge on Comprehensive Video Understanding in the Wild, 2018

Multi-modal Circulant Fusion for Video-to-Language and Backward.

[BibT_eX]

[DOI]

Proceedings of the Twenty-Seventh International Joint Conference on Artificial Intelligence, 2018

Universal Perturbation Generation for Black-box Attack Using Evolutionary Algorithms.

[BibT_eX]

[DOI]

Sivy Wang

Proceedings of the 24th International Conference on Pattern Recognition, 2018

Image-based Air Pollution Estimation Using Hybrid Convolutional Neural Network.

[BibT_eX]

[DOI]

Proceedings of the 24th International Conference on Pattern Recognition, 2018

Schmidt: Image Augmentation for Black-Box Adversarial Attack.

[BibT_eX]

[DOI]

Proceedings of the 2018 IEEE International Conference on Multimedia and Expo, 2018

Image-Based PM2.5 Estimation and its Application on Depth Estimation.

[BibT_eX]

[DOI]

Proceedings of the 2018 IEEE International Conference on Acoustics, 2018

Movie Question Answering: Remembering the Textual Cues for Layered Visual Contents.

[BibT_eX]

[DOI]

Proceedings of the Thirty-Second AAAI Conference on Artificial Intelligence, 2018

2017

Semisupervised Online Multikernel Similarity Learning for Image Retrieval.

[BibT_eX]

[DOI]

IEEE Trans. Multim., 2017

Semi-Supervised Image-to-Video Adaptation for Video Action Recognition.

[BibT_eX]

[DOI]

IEEE Trans. Cybern., 2017

Semi-supervised tensor learning for image classification.

[BibT_eX]

[DOI]

Multim. Syst., 2017

Guest Editorial: Intermediate representation for vision and multimedia applications.

[BibT_eX]

[DOI]

J. Vis. Commun. Image Represent., 2017

Efficient and Robust Lane Detection Using Three-Stage Feature Extraction with Line Fitting.

[BibT_eX]

[DOI]

Proceedings of the Advances in Multimedia Information Processing - PCM 2017, 2017

Spatio-Temporal Context Networks for Video Question Answering.

[BibT_eX]

[DOI]

Kun Gao

Proceedings of the Advances in Multimedia Information Processing - PCM 2017, 2017

Multirate Multimodal Video Captioning.

[BibT_eX]

[DOI]

Proceedings of the 2017 ACM on Multimedia Conference, 2017

Catching the Temporal Regions-of-Interest for Video Captioning.

[BibT_eX]

[DOI]

Ziwei Yang

Zheng Wang

Proceedings of the 2017 ACM on Multimedia Conference, 2017

Top attention in line with time: A light-weight strategy.

[BibT_eX]

[DOI]

Proceedings of the 2017 IEEE International Conference on Multimedia and Expo, 2017

Choose the Largest Contributor: A Fusion Coefficient Learning Network for Semantic Segmentation.

[BibT_eX]

[DOI]

Jianzhuang Yu

Shuai Zhao

Proceedings of the Internet Multimedia Computing and Service, 2017

Joint Deep Learning and Gaussian Representation for Person Re-identification.

[BibT_eX]

[DOI]

Nan Song

Xianglei Zhu

Proceedings of the Internet Multimedia Computing and Service, 2017

Initialized Frame Attention Networks for Video Question Answering.

[BibT_eX]

[DOI]

Kun Gao

Xianglei Zhu

Proceedings of the Internet Multimedia Computing and Service, 2017

Video Question Answering Using a Forget Memory Network.

[BibT_eX]

[DOI]

Yuanyuan Ge

Youjiang Xu

Proceedings of the Computer Vision - Second CCF Chinese Conference, 2017

2016

Guest editorial: web multimedia semantic inference using multi-cues.

[BibT_eX]

[DOI]

Xiaofang Zhou

World Wide Web, 2016

Sketch4Image: a novel framework for sketch-based image retrieval based on product quantization with coding residuals.

[BibT_eX]

[DOI]

Qiang Li

Jianwu Dang

Multim. Tools Appl., 2016

Image attribute learning with ontology guided fused lasso.

[BibT_eX]

[DOI]

Chao Li

Zhiyong Feng

Multim. Tools Appl., 2016

Tucker decomposition-based tensor learning for human action recognition.

[BibT_eX]

[DOI]

Multim. Syst., 2016

Semi-supervised feature selection via hierarchical regression for web image classification.

[BibT_eX]

[DOI]

Multim. Syst., 2016

Semi-supervised image clustering with multi-modal information.

[BibT_eX]

[DOI]

Jianqing Liang

Qinghua Hu

Multim. Syst., 2016

Combining neighborhood separable subspaces for classification via sparsity regularized optimization.

[BibT_eX]

[DOI]

Inf. Sci., 2016

Hierarchical support vector machine based structural classification with fused hierarchies.

[BibT_eX]

[DOI]

Neurocomputing, 2016

Cluster structure preserving unsupervised feature selection for multi-view tasks.

[BibT_eX]

[DOI]

Neurocomputing, 2016

Guest editorial: Adaptation methods for multimedia analysis.

[BibT_eX]

[DOI]

Neurocomputing, 2016

Describing Images with Ontology-Aware Dictionary Learning.

[BibT_eX]

[DOI]

Chengyue Zhang

Proceedings of the MultiMedia Modeling - 22nd International Conference, 2016

Large-Scale E-Commerce Image Retrieval with Top-Weighted Convolutional Neural Networks.

[BibT_eX]

[DOI]

Shichao Zhao

Youjiang Xu

Proceedings of the 2016 ACM on International Conference on Multimedia Retrieval, 2016

Describing images by feeding LSTM with structural words.

[BibT_eX]

[DOI]

Shubo Ma

Proceedings of the IEEE International Conference on Multimedia and Expo, 2016

TSMV: Task-Specific Multi-View Feature Learning.

[BibT_eX]

[DOI]

Chengyue Zhang

Proceedings of the International Conference on Internet Multimedia Computing and Service, 2016

2015

Semisupervised Feature Selection via Spline Regression for Video Semantic Recognition.

[BibT_eX]

[DOI]

IEEE Trans. Neural Networks Learn. Syst., 2015

Compact and Discriminative Descriptor Inference Using Multi-Cues.

[BibT_eX]

[DOI]

IEEE Trans. Image Process., 2015

Robust Face Clustering Via Tensor Decomposition.

[BibT_eX]

[DOI]

IEEE Trans. Cybern., 2015

An Object-Level High-Order Contextual Descriptor Based on Semantic, Spatial, and Scale Cues.

[BibT_eX]

[DOI]

IEEE Trans. Cybern., 2015

Guest Editorial: Ad Hoc Web Multimedia Analysis with Limited Supervision.

[BibT_eX]

[DOI]

Jingdong Wang

Multim. Tools Appl., 2015

Image aesthetics enhancement using composition-based saliency detection.

[BibT_eX]

[DOI]

Multim. Syst., 2015

Tensor rank selection for multimedia analysis.

[BibT_eX]

[DOI]

J. Vis. Commun. Image Represent., 2015

Pooling the Convolutional Layers in Deep ConvNets for Action Recognition.

[BibT_eX]

[DOI]

CoRR, 2015

Supervised Dictionary Learning Based on Relationship Between Edges and Levels.

[BibT_eX]

[DOI]

Qiang Guo

Proceedings of the Advances in Multimedia Information Processing - PCM 2015, 2015

Summarization-based Video Caption via Deep Neural Networks.

[BibT_eX]

[DOI]

Guang Li

Shubo Ma

Proceedings of the 23rd Annual ACM Conference on Multimedia Conference, MM '15, Brisbane, Australia, October 26, 2015

Describing Images with Hierarchical Concepts and Object Class Localization.

[BibT_eX]

[DOI]

Guang Li

Proceedings of the 5th ACM on International Conference on Multimedia Retrieval, 2015

Inferring Painting Style with Multi-Task Dictionary Learning.

[BibT_eX]

[DOI]

Proceedings of the Twenty-Fourth International Joint Conference on Artificial Intelligence, 2015

Discriminative multi-view feature selection and fusion.

[BibT_eX]

[DOI]

Yanbin Liu

Binbing Liao

Proceedings of the 2015 IEEE International Conference on Multimedia and Expo, 2015

Multi-layer supervised dictionary learning for visual classification.

[BibT_eX]

[DOI]

Qiang Guo

Chengyue Zhang

Proceedings of the 7th International Conference on Internet Multimedia Computing and Service, 2015

Exploiting the locality information of dense trajectory feature for human action recognition.

[BibT_eX]

[DOI]

Baixiang Fan

Yanbin Liu

Proceedings of the 7th International Conference on Internet Multimedia Computing and Service, 2015

2014

Image Attribute Adaptation.

[BibT_eX]

[DOI]

IEEE Trans. Multim., 2014

Augmenting Image Descriptions Using Structured Prediction Output.

[BibT_eX]

[DOI]

IEEE Trans. Multim., 2014

Regularity Preserved Superpixels and Supervoxels.

[BibT_eX]

[DOI]

IEEE Trans. Multim., 2014

Feature selection with spatial path coding for multimedia analysis.

[BibT_eX]

[DOI]

Inf. Sci., 2014

Image decomposing for inpainting using compressed sensing in DCT domain.

[BibT_eX]

[DOI]

Qiang Li

Jianwu Dang

Frontiers Comput. Sci., 2014

What Can We Learn about Motion Videos from Still Images?

[BibT_eX]

[DOI]

Proceedings of the ACM International Conference on Multimedia, MM '14, Orlando, FL, USA, November 03, 2014

Augmented Image Retrieval using Multi-order Object Layout with Attributes.

[BibT_eX]

[DOI]

Proceedings of the ACM International Conference on Multimedia, MM '14, Orlando, FL, USA, November 03, 2014

Attribute prediction with long-range interactions via path coding.

[BibT_eX]

[DOI]

Proceedings of the 2014 IEEE International Conference on Image Processing, 2014

Video Segmentation via Adaptive Higher-Order CRF with Windowed Dynamics.

[BibT_eX]

[DOI]

Proceedings of the International Conference on Internet Multimedia Computing and Service, 2014

A Real-World Web Cross-Media Dataset Containing Images, Texts and Videos.

[BibT_eX]

[DOI]

Yanbin Liu

Proceedings of the International Conference on Internet Multimedia Computing and Service, 2014

Locality Preserving Hashing Method for Image Retrieval.

[BibT_eX]

[DOI]

Qiang Li

Jianwu Dang

Proceedings of the International Conference on Internet Multimedia Computing and Service, 2014

Output Feature Augmented Lasso.

[BibT_eX]

[DOI]

Proceedings of the 2014 IEEE International Conference on Data Mining, 2014

2013

Discovering Discriminative Graphlets for Aerial Image Categories Recognition.

[BibT_eX]

[DOI]

IEEE Trans. Image Process., 2013

Image classification with manifold learning for out-of-sample data.

[BibT_eX]

[DOI]

Signal Process., 2013

Unified Dictionary Learning and Region Tagging with Hierarchical Sparse Representation.

[BibT_eX]

[DOI]

Alexander G. Hauptmann

Comput. Vis. Image Underst., 2013

Object coding on the semantic graph for scene classification.

[BibT_eX]

[DOI]

Proceedings of the ACM Multimedia Conference, 2013

Co-Regularized Ensemble for Feature Selection.

[BibT_eX]

[DOI]

Xiaofang Zhou

Proceedings of the IJCAI 2013, 2013

Robust Tensor Clustering with Non-Greedy Maximization.

[BibT_eX]

[DOI]

Proceedings of the IJCAI 2013, 2013

Visual saliency detection based on photographic composition.

[BibT_eX]

[DOI]

Proceedings of the International Conference on Internet Multimedia Computing and Service, 2013

Discriminative Multi-Task Feature Selection.

[BibT_eX]

[DOI]

Proceedings of the Late-Breaking Developments in the Field of Artificial Intelligence, 2013

2012

Image Annotation by Input-Output Structural Grouping Sparsity.

[BibT_eX]

[DOI]

IEEE Trans. Image Process., 2012

Sparse Unsupervised Dimensionality Reduction for Multiple View Data.

[BibT_eX]

[DOI]

IEEE Trans. Circuits Syst. Video Technol., 2012

The heterogeneous feature selection with structural sparsity for multimedia annotation and hashing: a survey.

[BibT_eX]

[DOI]

Int. J. Multim. Inf. Retr., 2012

Correlated attribute transfer with multi-task graph-guided fusion.

[BibT_eX]

[DOI]

Proceedings of the 20th ACM Multimedia Conference, MM '12, Nara, Japan, October 29, 2012

Graph-guided sparse reconstruction for region tagging.

[BibT_eX]

[DOI]

Proceedings of the 2012 IEEE Conference on Computer Vision and Pattern Recognition, 2012

2011

Stable multi-label boosting for image annotation with structural feature selection.

[BibT_eX]

[DOI]

Sci. China Inf. Sci., 2011

Multi-label Image Annotation by Structural Grouping Sparsity.

[BibT_eX]

[DOI]

Fei Wu

Yueting Zhuang

Proceedings of the Social Media Modeling and Computing., 2011

2010

Multi-Label Transfer Learning With Sparse Representation.

[BibT_eX]

[DOI]

IEEE Trans. Circuits Syst. Video Technol., 2010

Multiple hypergraph ranking for video concept detection.

[BibT_eX]

[DOI]

J. Zhejiang Univ. Sci. C, 2010

Multiple Hypergraph Clustering of Web Images by MiningWord2Image Correlations.

[BibT_eX]

[DOI]

Fei Wu

Yueting Zhuang

J. Comput. Sci. Technol., 2010

Multi-label boosting for image annotation by structural grouping sparsity.

[BibT_eX]

[DOI]

Proceedings of the 18th International Conference on Multimedia 2010, 2010

Multi-Task Sparse Discriminant Analysis (MtSDA) with Overlapping Categories.

[BibT_eX]

[DOI]

Proceedings of the Twenty-Fourth AAAI Conference on Artificial Intelligence, 2010

2009

Application of Apriori Algorithm in Oracle Bone Inscription Explication.

[BibT_eX]

[DOI]

Yongge Liu