Whamcloud - gitweb
LU-17705 ptlrpc: replace synchronize_rcu() with rcu_barrier()
[fs/lustre-release.git] / lustre / obdclass / cl_object.c
index 9844ed0..e3bc29f 100644 (file)
@@ -27,7 +27,6 @@
  */
 /*
  * This file is part of Lustre, http://www.lustre.org/
- * Lustre is a trademark of Sun Microsystems, Inc.
  *
  * Client Lustre Object.
  *
 #include <obd_class.h>
 #include <obd_support.h>
 #include <lustre_fid.h>
-#include <libcfs/libcfs_hash.h> /* for cfs_hash stuff */
 #include <cl_object.h>
 #include <lu_object.h>
 #include "cl_internal.h"
 
 static struct kmem_cache *cl_env_kmem;
 struct kmem_cache *cl_dio_aio_kmem;
+struct kmem_cache *cl_sub_dio_kmem;
 struct kmem_cache *cl_page_kmem_array[16];
 unsigned short cl_page_kmem_size_array[16];
 
@@ -199,18 +198,16 @@ EXPORT_SYMBOL(cl_object_attr_unlock);
  * top-to-bottom to fill in parts of \a attr that this layer is responsible
  * for.
  */
-int cl_object_attr_get(const struct lu_env *env, struct cl_object *obj,
+int cl_object_attr_get(const struct lu_env *env, struct cl_object *top,
                        struct cl_attr *attr)
 {
-       struct lu_object_header *top;
-       int result;
+       struct cl_object *obj;
+       int result = 0;
 
-       assert_spin_locked(cl_object_attr_guard(obj));
+       assert_spin_locked(cl_object_attr_guard(top));
        ENTRY;
 
-       top = obj->co_lu.lo_header;
-       result = 0;
-       list_for_each_entry(obj, &top->loh_layers, co_lu.lo_linkage) {
+       cl_object_for_each(obj, top) {
                if (obj->co_ops->coo_attr_get != NULL) {
                        result = obj->co_ops->coo_attr_get(env, obj, attr);
                        if (result != 0) {
@@ -231,18 +228,16 @@ EXPORT_SYMBOL(cl_object_attr_get);
  * updated. Calls cl_object_operations::coo_upd_attr() on every layer, bottom
  * to top.
  */
-int cl_object_attr_update(const struct lu_env *env, struct cl_object *obj,
+int cl_object_attr_update(const struct lu_env *env, struct cl_object *top,
                          const struct cl_attr *attr, unsigned v)
 {
-       struct lu_object_header *top;
-       int result;
+       struct cl_object *obj;
+       int result = 0;
 
-       assert_spin_locked(cl_object_attr_guard(obj));
+       assert_spin_locked(cl_object_attr_guard(top));
        ENTRY;
 
-       top = obj->co_lu.lo_header;
-       result = 0;
-       list_for_each_entry_reverse(obj, &top->loh_layers, co_lu.lo_linkage) {
+       cl_object_for_each_reverse(obj, top) {
                if (obj->co_ops->coo_attr_update != NULL) {
                        result = obj->co_ops->coo_attr_update(env, obj, attr,
                                                              v);
@@ -258,6 +253,25 @@ int cl_object_attr_update(const struct lu_env *env, struct cl_object *obj,
 EXPORT_SYMBOL(cl_object_attr_update);
 
 /**
+ * Mark the inode as dirty when the inode has uncommitted (unstable) pages.
+ * Thus when the system is under momory pressure, it will trigger writeback
+ * on background to commit and unpin the pages.
+ */
+void cl_object_dirty_for_sync(const struct lu_env *env, struct cl_object *top)
+{
+       struct cl_object *obj;
+
+       ENTRY;
+
+       cl_object_for_each(obj, top) {
+               if (obj->co_ops->coo_dirty_for_sync != NULL)
+                       obj->co_ops->coo_dirty_for_sync(env, obj);
+       }
+       EXIT;
+}
+EXPORT_SYMBOL(cl_object_dirty_for_sync);
+
+/**
  * Notifies layers (bottom-to-top) that glimpse AST was received.
  *
  * Layers have to fill \a lvb fields with information that will be shipped
@@ -265,70 +279,63 @@ EXPORT_SYMBOL(cl_object_attr_update);
  *
  * \see cl_lock_operations::clo_glimpse()
  */
-int cl_object_glimpse(const struct lu_env *env, struct cl_object *obj,
-                      struct ost_lvb *lvb)
+int cl_object_glimpse(const struct lu_env *env, struct cl_object *top,
+                     struct ost_lvb *lvb)
 {
-        struct lu_object_header *top;
-        int result;
+       struct cl_object *obj;
+       int result = 0;
 
-        ENTRY;
-        top = obj->co_lu.lo_header;
-        result = 0;
-       list_for_each_entry_reverse(obj, &top->loh_layers, co_lu.lo_linkage) {
-                if (obj->co_ops->coo_glimpse != NULL) {
-                        result = obj->co_ops->coo_glimpse(env, obj, lvb);
-                        if (result != 0)
-                                break;
-                }
-        }
-        LU_OBJECT_HEADER(D_DLMTRACE, env, lu_object_top(top),
+       ENTRY;
+       cl_object_for_each_reverse(obj, top) {
+               if (obj->co_ops->coo_glimpse != NULL) {
+                       result = obj->co_ops->coo_glimpse(env, obj, lvb);
+                       if (result != 0)
+                               break;
+               }
+       }
+       LU_OBJECT_HEADER(D_DLMTRACE, env, lu_object_top(top->co_lu.lo_header),
                         "size: %llu mtime: %llu atime: %llu "
                         "ctime: %llu blocks: %llu\n",
-                         lvb->lvb_size, lvb->lvb_mtime, lvb->lvb_atime,
-                         lvb->lvb_ctime, lvb->lvb_blocks);
-        RETURN(result);
+                        lvb->lvb_size, lvb->lvb_mtime, lvb->lvb_atime,
+                        lvb->lvb_ctime, lvb->lvb_blocks);
+       RETURN(result);
 }
 EXPORT_SYMBOL(cl_object_glimpse);
 
 /**
  * Updates a configuration of an object \a obj.
  */
-int cl_conf_set(const struct lu_env *env, struct cl_object *obj,
-                const struct cl_object_conf *conf)
+int cl_conf_set(const struct lu_env *env, struct cl_object *top,
+               const struct cl_object_conf *conf)
 {
-        struct lu_object_header *top;
-        int result;
+       struct cl_object *obj;
+       int result = 0;
 
-        ENTRY;
-        top = obj->co_lu.lo_header;
-        result = 0;
-       list_for_each_entry(obj, &top->loh_layers, co_lu.lo_linkage) {
-                if (obj->co_ops->coo_conf_set != NULL) {
-                        result = obj->co_ops->coo_conf_set(env, obj, conf);
-                        if (result != 0)
-                                break;
-                }
-        }
-        RETURN(result);
+       ENTRY;
+       cl_object_for_each(obj, top) {
+               if (obj->co_ops->coo_conf_set != NULL) {
+                       result = obj->co_ops->coo_conf_set(env, obj, conf);
+                       if (result)
+                               break;
+               }
+       }
+       RETURN(result);
 }
 EXPORT_SYMBOL(cl_conf_set);
 
 /**
  * Prunes caches of pages and locks for this object.
  */
-int cl_object_prune(const struct lu_env *env, struct cl_object *obj)
+int cl_object_prune(const struct lu_env *env, struct cl_object *top)
 {
-       struct lu_object_header *top;
-       struct cl_object *o;
-       int result;
+       struct cl_object *obj;
+       int result = 0;
        ENTRY;
 
-       top = obj->co_lu.lo_header;
-       result = 0;
-       list_for_each_entry(o, &top->loh_layers, co_lu.lo_linkage) {
-               if (o->co_ops->coo_prune != NULL) {
-                       result = o->co_ops->coo_prune(env, o);
-                       if (result != 0)
+       cl_object_for_each(obj, top) {
+               if (obj->co_ops->coo_prune != NULL) {
+                       result = obj->co_ops->coo_prune(env, obj);
+                       if (result)
                                break;
                }
        }
@@ -340,19 +347,18 @@ EXPORT_SYMBOL(cl_object_prune);
 /**
  * Get stripe information of this object.
  */
-int cl_object_getstripe(const struct lu_env *env, struct cl_object *obj,
+int cl_object_getstripe(const struct lu_env *env, struct cl_object *top,
                        struct lov_user_md __user *uarg, size_t size)
 {
-       struct lu_object_header *top;
-       int                     result = 0;
+       struct cl_object *obj;
+       int result = 0;
        ENTRY;
 
-       top = obj->co_lu.lo_header;
-       list_for_each_entry(obj, &top->loh_layers, co_lu.lo_linkage) {
-               if (obj->co_ops->coo_getstripe != NULL) {
+       cl_object_for_each(obj, top) {
+               if (obj->co_ops->coo_getstripe) {
                        result = obj->co_ops->coo_getstripe(env, obj, uarg,
                                                            size);
-                       if (result != 0)
+                       if (result)
                                break;
                }
        }
@@ -372,20 +378,19 @@ EXPORT_SYMBOL(cl_object_getstripe);
  * \retval 0   success
  * \retval < 0 error
  */
-int cl_object_fiemap(const struct lu_env *env, struct cl_object *obj,
+int cl_object_fiemap(const struct lu_env *env, struct cl_object *top,
                     struct ll_fiemap_info_key *key,
                     struct fiemap *fiemap, size_t *buflen)
 {
-       struct lu_object_header *top;
-       int                     result = 0;
+       struct cl_object *obj;
+       int result = 0;
        ENTRY;
 
-       top = obj->co_lu.lo_header;
-       list_for_each_entry(obj, &top->loh_layers, co_lu.lo_linkage) {
-               if (obj->co_ops->coo_fiemap != NULL) {
+       cl_object_for_each(obj, top) {
+               if (obj->co_ops->coo_fiemap) {
                        result = obj->co_ops->coo_fiemap(env, obj, key, fiemap,
                                                         buflen);
-                       if (result != 0)
+                       if (result)
                                break;
                }
        }
@@ -393,14 +398,14 @@ int cl_object_fiemap(const struct lu_env *env, struct cl_object *obj,
 }
 EXPORT_SYMBOL(cl_object_fiemap);
 
-int cl_object_layout_get(const struct lu_env *env, struct cl_object *obj,
+int cl_object_layout_get(const struct lu_env *env, struct cl_object *top,
                         struct cl_layout *cl)
 {
-       struct lu_object_header *top = obj->co_lu.lo_header;
+       struct cl_object *obj;
        ENTRY;
 
-       list_for_each_entry(obj, &top->loh_layers, co_lu.lo_linkage) {
-               if (obj->co_ops->coo_layout_get != NULL)
+       cl_object_for_each(obj, top) {
+               if (obj->co_ops->coo_layout_get)
                        return obj->co_ops->coo_layout_get(env, obj, cl);
        }
 
@@ -408,14 +413,14 @@ int cl_object_layout_get(const struct lu_env *env, struct cl_object *obj,
 }
 EXPORT_SYMBOL(cl_object_layout_get);
 
-loff_t cl_object_maxbytes(struct cl_object *obj)
+loff_t cl_object_maxbytes(struct cl_object *top)
 {
-       struct lu_object_header *top = obj->co_lu.lo_header;
+       struct cl_object *obj;
        loff_t maxbytes = LLONG_MAX;
        ENTRY;
 
-       list_for_each_entry(obj, &top->loh_layers, co_lu.lo_linkage) {
-               if (obj->co_ops->coo_maxbytes != NULL)
+       cl_object_for_each(obj, top) {
+               if (obj->co_ops->coo_maxbytes)
                        maxbytes = min_t(loff_t, obj->co_ops->coo_maxbytes(obj),
                                         maxbytes);
        }
@@ -424,14 +429,14 @@ loff_t cl_object_maxbytes(struct cl_object *obj)
 }
 EXPORT_SYMBOL(cl_object_maxbytes);
 
-int cl_object_flush(const struct lu_env *env, struct cl_object *obj,
+int cl_object_flush(const struct lu_env *env, struct cl_object *top,
                         struct ldlm_lock *lock)
 {
-       struct lu_object_header *top = obj->co_lu.lo_header;
+       struct cl_object *obj;
        int rc = 0;
        ENTRY;
 
-       list_for_each_entry(obj, &top->loh_layers, co_lu.lo_linkage) {
+       cl_object_for_each(obj, top) {
                if (obj->co_ops->coo_object_flush) {
                        rc = obj->co_ops->coo_object_flush(env, obj, lock);
                        if (rc)
@@ -442,6 +447,25 @@ int cl_object_flush(const struct lu_env *env, struct cl_object *obj,
 }
 EXPORT_SYMBOL(cl_object_flush);
 
+int cl_object_inode_ops(const struct lu_env *env, struct cl_object *top,
+                       enum coo_inode_opc opc, void *data)
+{
+       struct cl_object *obj;
+       int rc = 0;
+
+       ENTRY;
+
+       cl_object_for_each(obj, top) {
+               if (obj->co_ops->coo_inode_ops) {
+                       rc = obj->co_ops->coo_inode_ops(env, obj, opc, data);
+                       if (rc)
+                               break;
+               }
+       }
+       RETURN(rc);
+}
+EXPORT_SYMBOL(cl_object_inode_ops);
+
 /**
  * Helper function removing all object locks, and marking object for
  * deletion. All object pages must have been deleted at this point.
@@ -534,7 +558,7 @@ static struct cache_stats cl_env_stats = {
  */
 int cl_site_stats_print(const struct cl_site *site, struct seq_file *m)
 {
-       static const char *pstate[] = {
+       static const char *const pstate[] = {
                [CPS_CACHED]    = "c",
                [CPS_OWNED]     = "o",
                [CPS_PAGEOUT]   = "w",
@@ -568,21 +592,6 @@ EXPORT_SYMBOL(cl_site_stats_print);
  *
  */
 
-/**
- * The most efficient way is to store cl_env pointer in task specific
- * structures. On Linux, it isn't easy to use task_struct->journal_info
- * because Lustre code may call into other fs during memory reclaim, which
- * has certain assumptions about journal_info. There are not currently any
- * fields in task_struct that can be used for this purpose.
- * \note As long as we use task_struct to store cl_env, we assume that once
- * called into Lustre, we'll never call into the other part of the kernel
- * which will use those fields in task_struct without explicitly exiting
- * Lustre.
- *
- * Since there's no space in task_struct is available, hash will be used.
- * bz20044, bz22683.
- */
-
 static unsigned cl_envs_cached_max = 32; /* XXX: prototype: arbitrary limit
                                          * for now. */
 static struct cl_env_cache {
@@ -681,6 +690,9 @@ static void cl_env_fini(struct cl_env *cle)
        OBD_SLAB_FREE_PTR(cle, cl_env_kmem);
 }
 
+/* Get a cl_env, either from the per-CPU cache for the current CPU, or by
+ * allocating a new one.
+ */
 static struct lu_env *cl_env_obtain(void *debug)
 {
        struct cl_env *cle;
@@ -727,10 +739,14 @@ static inline struct cl_env *cl_env_container(struct lu_env *env)
 }
 
 /**
- * Returns lu_env: if there already is an environment associated with the
- * current thread, it is returned, otherwise, new environment is allocated.
+ * Returns an lu_env.
  *
- * Allocations are amortized through the global cache of environments.
+ * No link to thread, this returns an env from the cache or
+ * allocates a new one.
+ *
+ * If you need to get the specific environment you created for this thread,
+ * you must either pass the pointer directly or store it in the file/inode
+ * private data and retrieve it from there using ll_cl_add/ll_cl_find.
  *
  * \param refcheck pointer to a counter used to detect environment leaks. In
  * the usual case cl_env_get() and cl_env_put() are called in the same lexical
@@ -818,8 +834,8 @@ EXPORT_SYMBOL(cl_env_cache_purge);
  * Release an environment.
  *
  * Decrement \a env reference counter. When counter drops to 0, nothing in
- * this thread is using environment and it is returned to the allocation
- * cache, or freed straight away, if cache is large enough.
+ * this thread is using environment and it is returned to the per-CPU cache or
+ * freed immediately if the cache is full.
  */
 void cl_env_put(struct lu_env *env, __u16 *refcheck)
 {
@@ -887,6 +903,7 @@ void cl_lvb2attr(struct cl_attr *attr, const struct ost_lvb *lvb)
 EXPORT_SYMBOL(cl_lvb2attr);
 
 static struct cl_env cl_env_percpu[NR_CPUS];
+static DEFINE_MUTEX(cl_env_percpu_mutex);
 
 static int cl_env_percpu_init(void)
 {
@@ -951,8 +968,10 @@ static void cl_env_percpu_refill(void)
 {
        int i;
 
+       mutex_lock(&cl_env_percpu_mutex);
        for_each_possible_cpu(i)
                lu_env_refill(&cl_env_percpu[i].ce_lu);
+       mutex_unlock(&cl_env_percpu_mutex);
 }
 
 void cl_env_percpu_put(struct lu_env *env)
@@ -1060,6 +1079,11 @@ static struct lu_kmem_descr cl_object_caches[] = {
                .ckd_size  = sizeof(struct cl_dio_aio)
        },
        {
+               .ckd_cache = &cl_sub_dio_kmem,
+               .ckd_name  = "cl_sub_dio_kmem",
+               .ckd_size  = sizeof(struct cl_sub_dio)
+       },
+       {
                .ckd_cache = NULL
        }
 };
@@ -1074,7 +1098,7 @@ int cl_global_init(void)
 {
        int result;
 
-       OBD_ALLOC(cl_envs, sizeof(*cl_envs) * num_possible_cpus());
+       OBD_ALLOC_PTR_ARRAY(cl_envs, num_possible_cpus());
        if (cl_envs == NULL)
                GOTO(out, result = -ENOMEM);
 
@@ -1098,7 +1122,7 @@ out_keys:
 out_kmem:
        lu_kmem_fini(cl_object_caches);
 out_envs:
-       OBD_FREE(cl_envs, sizeof(*cl_envs) * num_possible_cpus());
+       OBD_FREE_PTR_ARRAY(cl_envs, num_possible_cpus());
 out:
        return result;
 }
@@ -1119,5 +1143,5 @@ void cl_global_fini(void)
        cl_env_percpu_fini();
        lu_context_key_degister(&cl_key);
        lu_kmem_fini(cl_object_caches);
-       OBD_FREE(cl_envs, sizeof(*cl_envs) * num_possible_cpus());
+       OBD_FREE_PTR_ARRAY(cl_envs, num_possible_cpus());
 }