Whamcloud - gitweb
LU-4257 obdclass: Get rid of cl_env hash table
[fs/lustre-release.git] / lustre / obdclass / cl_object.c
index f006dd0..8f6705e 100644 (file)
@@ -569,39 +569,19 @@ EXPORT_SYMBOL(cl_site_stats_print);
  * bz20044, bz22683.
  */
 
-static struct list_head cl_envs;
-static unsigned cl_envs_cached_nr  = 0;
-static unsigned cl_envs_cached_max = 128; /* XXX: prototype: arbitrary limit
-                                           * for now. */
-static DEFINE_SPINLOCK(cl_envs_guard);
+static unsigned cl_envs_cached_max = 32; /* XXX: prototype: arbitrary limit
+                                         * for now. */
+static struct cl_env_cache {
+       rwlock_t                cec_guard;
+       unsigned                cec_count;
+       struct list_head        cec_envs;
+} *cl_envs = NULL;
 
 struct cl_env {
         void             *ce_magic;
         struct lu_env     ce_lu;
         struct lu_context ce_ses;
 
-#ifdef LL_TASK_CL_ENV
-        void             *ce_prev;
-#else
-        /**
-         * This allows cl_env to be entered into cl_env_hash which implements
-         * the current thread -> client environment lookup.
-         */
-       struct hlist_node  ce_node;
-#endif
-       /**
-        * Owner for the current cl_env.
-        *
-        * If LL_TASK_CL_ENV is defined, this point to the owning current,
-        * only for debugging purpose ;
-        * Otherwise hash is used, and this is the key for cfs_hash.
-        * Now current thread pid is stored. Note using thread pointer would
-        * lead to unbalanced hash because of its specific allocation locality
-        * and could be varied for different platforms and OSes, even different
-        * OS versions.
-        */
-       void             *ce_owner;
-
         /*
          * Linkage into global list of all client environments. Used for
          * garbage collection.
@@ -632,159 +612,13 @@ struct cl_env {
 
 static void cl_env_init0(struct cl_env *cle, void *debug)
 {
-        LASSERT(cle->ce_ref == 0);
-        LASSERT(cle->ce_magic == &cl_env_init0);
-        LASSERT(cle->ce_debug == NULL && cle->ce_owner == NULL);
-
-        cle->ce_ref = 1;
-        cle->ce_debug = debug;
-        CL_ENV_INC(busy);
-}
-
-
-#ifndef LL_TASK_CL_ENV
-/*
- * The implementation of using hash table to connect cl_env and thread
- */
-
-static struct cfs_hash *cl_env_hash;
-
-static unsigned cl_env_hops_hash(struct cfs_hash *lh,
-                                 const void *key, unsigned mask)
-{
-#if BITS_PER_LONG == 64
-        return cfs_hash_u64_hash((__u64)key, mask);
-#else
-        return cfs_hash_u32_hash((__u32)key, mask);
-#endif
-}
-
-static void *cl_env_hops_obj(struct hlist_node *hn)
-{
-       struct cl_env *cle = hlist_entry(hn, struct cl_env, ce_node);
-
+       LASSERT(cle->ce_ref == 0);
        LASSERT(cle->ce_magic == &cl_env_init0);
-       return (void *)cle;
-}
-
-static int cl_env_hops_keycmp(const void *key, struct hlist_node *hn)
-{
-        struct cl_env *cle = cl_env_hops_obj(hn);
+       LASSERT(cle->ce_debug == NULL);
 
-        LASSERT(cle->ce_owner != NULL);
-        return (key == cle->ce_owner);
-}
-
-static void cl_env_hops_noop(struct cfs_hash *hs, struct hlist_node *hn)
-{
-       struct cl_env *cle = hlist_entry(hn, struct cl_env, ce_node);
-        LASSERT(cle->ce_magic == &cl_env_init0);
-}
-
-static struct cfs_hash_ops cl_env_hops = {
-        .hs_hash        = cl_env_hops_hash,
-        .hs_key         = cl_env_hops_obj,
-        .hs_keycmp      = cl_env_hops_keycmp,
-        .hs_object      = cl_env_hops_obj,
-        .hs_get         = cl_env_hops_noop,
-        .hs_put_locked  = cl_env_hops_noop,
-};
-
-static inline struct cl_env *cl_env_fetch(void)
-{
-       struct cl_env *cle;
-
-       cle = cfs_hash_lookup(cl_env_hash, (void *) (long) current->pid);
-       LASSERT(ergo(cle, cle->ce_magic == &cl_env_init0));
-       return cle;
-}
-
-static inline void cl_env_attach(struct cl_env *cle)
-{
-       if (cle) {
-               int rc;
-
-               LASSERT(cle->ce_owner == NULL);
-               cle->ce_owner = (void *) (long) current->pid;
-               rc = cfs_hash_add_unique(cl_env_hash, cle->ce_owner,
-                                        &cle->ce_node);
-               LASSERT(rc == 0);
-       }
-}
-
-static inline void cl_env_do_detach(struct cl_env *cle)
-{
-       void *cookie;
-
-       LASSERT(cle->ce_owner == (void *) (long) current->pid);
-       cookie = cfs_hash_del(cl_env_hash, cle->ce_owner,
-                             &cle->ce_node);
-       LASSERT(cookie == cle);
-       cle->ce_owner = NULL;
-}
-
-static int cl_env_store_init(void) {
-        cl_env_hash = cfs_hash_create("cl_env",
-                                      HASH_CL_ENV_BITS, HASH_CL_ENV_BITS,
-                                      HASH_CL_ENV_BKT_BITS, 0,
-                                      CFS_HASH_MIN_THETA,
-                                      CFS_HASH_MAX_THETA,
-                                      &cl_env_hops,
-                                      CFS_HASH_RW_BKTLOCK);
-        return cl_env_hash != NULL ? 0 :-ENOMEM;
-}
-
-static void cl_env_store_fini(void) {
-        cfs_hash_putref(cl_env_hash);
-}
-
-#else /* LL_TASK_CL_ENV */
-/*
- * The implementation of store cl_env directly in thread structure.
- */
-
-static inline struct cl_env *cl_env_fetch(void)
-{
-       struct cl_env *cle;
-
-       cle = current->LL_TASK_CL_ENV;
-       if (cle && cle->ce_magic != &cl_env_init0)
-               cle = NULL;
-       return cle;
-}
-
-static inline void cl_env_attach(struct cl_env *cle)
-{
-       if (cle) {
-               LASSERT(cle->ce_owner == NULL);
-               cle->ce_owner = current;
-               cle->ce_prev = current->LL_TASK_CL_ENV;
-               current->LL_TASK_CL_ENV = cle;
-       }
-}
-
-static inline void cl_env_do_detach(struct cl_env *cle)
-{
-       LASSERT(cle->ce_owner == current);
-       LASSERT(current->LL_TASK_CL_ENV == cle);
-       current->LL_TASK_CL_ENV = cle->ce_prev;
-       cle->ce_owner = NULL;
-}
-
-static int cl_env_store_init(void) { return 0; }
-static void cl_env_store_fini(void) { }
-
-#endif /* LL_TASK_CL_ENV */
-
-static inline struct cl_env *cl_env_detach(struct cl_env *cle)
-{
-        if (cle == NULL)
-                cle = cl_env_fetch();
-
-        if (cle && cle->ce_owner)
-                cl_env_do_detach(cle);
-
-        return cle;
+       cle->ce_ref = 1;
+       cle->ce_debug = debug;
+       CL_ENV_INC(busy);
 }
 
 static struct lu_env *cl_env_new(__u32 ctx_tags, __u32 ses_tags, void *debug)
@@ -834,17 +668,22 @@ static struct lu_env *cl_env_obtain(void *debug)
 {
        struct cl_env *cle;
        struct lu_env *env;
+       int cpu = get_cpu();
 
        ENTRY;
-       spin_lock(&cl_envs_guard);
-       LASSERT(equi(cl_envs_cached_nr == 0, list_empty(&cl_envs)));
-       if (cl_envs_cached_nr > 0) {
+
+       read_lock(&cl_envs[cpu].cec_guard);
+       LASSERT(equi(cl_envs[cpu].cec_count == 0,
+               list_empty(&cl_envs[cpu].cec_envs)));
+       if (cl_envs[cpu].cec_count > 0) {
                int rc;
 
-               cle = container_of(cl_envs.next, struct cl_env, ce_linkage);
+               cle = container_of(cl_envs[cpu].cec_envs.next, struct cl_env,
+                                  ce_linkage);
                list_del_init(&cle->ce_linkage);
-               cl_envs_cached_nr--;
-               spin_unlock(&cl_envs_guard);
+               cl_envs[cpu].cec_count--;
+               read_unlock(&cl_envs[cpu].cec_guard);
+               put_cpu();
 
                 env = &cle->ce_lu;
                 rc = lu_env_refill(env);
@@ -857,7 +696,8 @@ static struct lu_env *cl_env_obtain(void *debug)
                         env = ERR_PTR(rc);
                 }
         } else {
-               spin_unlock(&cl_envs_guard);
+               read_unlock(&cl_envs[cpu].cec_guard);
+               put_cpu();
                env = cl_env_new(lu_context_tags_default,
                                 lu_session_tags_default, debug);
        }
@@ -869,27 +709,6 @@ static inline struct cl_env *cl_env_container(struct lu_env *env)
         return container_of(env, struct cl_env, ce_lu);
 }
 
-struct lu_env *cl_env_peek(__u16 *refcheck)
-{
-        struct lu_env *env;
-        struct cl_env *cle;
-
-        CL_ENV_INC(lookup);
-
-        /* check that we don't go far from untrusted pointer */
-        CLASSERT(offsetof(struct cl_env, ce_magic) == 0);
-
-        env = NULL;
-        cle = cl_env_fetch();
-        if (cle != NULL) {
-                CL_ENV_INC(hit);
-                env = &cle->ce_lu;
-                *refcheck = ++cle->ce_ref;
-        }
-        CDEBUG(D_OTHER, "%d@%p\n", cle ? cle->ce_ref : 0, cle);
-        return env;
-}
-
 /**
  * Returns lu_env: if there already is an environment associated with the
  * current thread, it is returned, otherwise, new environment is allocated.
@@ -907,17 +726,13 @@ struct lu_env *cl_env_get(__u16 *refcheck)
 {
         struct lu_env *env;
 
-        env = cl_env_peek(refcheck);
-        if (env == NULL) {
-                env = cl_env_obtain(__builtin_return_address(0));
-                if (!IS_ERR(env)) {
-                        struct cl_env *cle;
+       env = cl_env_obtain(__builtin_return_address(0));
+       if (!IS_ERR(env)) {
+               struct cl_env *cle;
 
-                        cle = cl_env_container(env);
-                        cl_env_attach(cle);
-                        *refcheck = cle->ce_ref;
-                        CDEBUG(D_OTHER, "%d@%p\n", cle->ce_ref, cle);
-                }
+               cle = cl_env_container(env);
+               *refcheck = cle->ce_ref;
+               CDEBUG(D_OTHER, "%d@%p\n", cle->ce_ref, cle);
         }
         return env;
 }
@@ -932,7 +747,6 @@ struct lu_env *cl_env_alloc(__u16 *refcheck, __u32 tags)
 {
         struct lu_env *env;
 
-        LASSERT(cl_env_peek(refcheck) == NULL);
         env = cl_env_new(tags, tags, __builtin_return_address(0));
         if (!IS_ERR(env)) {
                 struct cl_env *cle;
@@ -947,7 +761,6 @@ EXPORT_SYMBOL(cl_env_alloc);
 
 static void cl_env_exit(struct cl_env *cle)
 {
-        LASSERT(cle->ce_owner == NULL);
         lu_context_exit(&cle->ce_lu.le_ctx);
         lu_context_exit(&cle->ce_ses);
 }
@@ -960,21 +773,26 @@ static void cl_env_exit(struct cl_env *cle)
 unsigned cl_env_cache_purge(unsigned nr)
 {
        struct cl_env *cle;
+       unsigned i;
 
        ENTRY;
-       spin_lock(&cl_envs_guard);
-       for (; !list_empty(&cl_envs) && nr > 0; --nr) {
-               cle = container_of(cl_envs.next, struct cl_env, ce_linkage);
-               list_del_init(&cle->ce_linkage);
-               LASSERT(cl_envs_cached_nr > 0);
-               cl_envs_cached_nr--;
-               spin_unlock(&cl_envs_guard);
+       for_each_possible_cpu(i) {
+               write_lock(&cl_envs[i].cec_guard);
+               for (; !list_empty(&cl_envs[i].cec_envs) && nr > 0; --nr) {
+                       cle = container_of(cl_envs[i].cec_envs.next,
+                                          struct cl_env, ce_linkage);
+                       list_del_init(&cle->ce_linkage);
+                       LASSERT(cl_envs[i].cec_count > 0);
+                       cl_envs[i].cec_count--;
+                       write_unlock(&cl_envs[i].cec_guard);
 
-               cl_env_fini(cle);
-               spin_lock(&cl_envs_guard);
+                       cl_env_fini(cle);
+                       write_lock(&cl_envs[i].cec_guard);
+               }
+               LASSERT(equi(cl_envs[i].cec_count == 0,
+                       list_empty(&cl_envs[i].cec_envs)));
+               write_unlock(&cl_envs[i].cec_guard);
        }
-       LASSERT(equi(cl_envs_cached_nr == 0, list_empty(&cl_envs)));
-       spin_unlock(&cl_envs_guard);
        RETURN(nr);
 }
 EXPORT_SYMBOL(cl_env_cache_purge);
@@ -997,8 +815,9 @@ void cl_env_put(struct lu_env *env, __u16 *refcheck)
 
         CDEBUG(D_OTHER, "%d@%p\n", cle->ce_ref, cle);
         if (--cle->ce_ref == 0) {
+               int cpu = get_cpu();
+
                 CL_ENV_DEC(busy);
-                cl_env_detach(cle);
                 cle->ce_debug = NULL;
                 cl_env_exit(cle);
                 /*
@@ -1007,108 +826,21 @@ void cl_env_put(struct lu_env *env, __u16 *refcheck)
                  * Return environment to the cache only when it was allocated
                  * with the standard tags.
                  */
-                if (cl_envs_cached_nr < cl_envs_cached_max &&
-                    (env->le_ctx.lc_tags & ~LCT_HAS_EXIT) == LCT_CL_THREAD &&
-                    (env->le_ses->lc_tags & ~LCT_HAS_EXIT) == LCT_SESSION) {
-                       spin_lock(&cl_envs_guard);
-                       list_add(&cle->ce_linkage, &cl_envs);
-                       cl_envs_cached_nr++;
-                       spin_unlock(&cl_envs_guard);
+               if (cl_envs[cpu].cec_count < cl_envs_cached_max &&
+                   (env->le_ctx.lc_tags & ~LCT_HAS_EXIT) == LCT_CL_THREAD &&
+                   (env->le_ses->lc_tags & ~LCT_HAS_EXIT) == LCT_SESSION) {
+                       read_lock(&cl_envs[cpu].cec_guard);
+                       list_add(&cle->ce_linkage, &cl_envs[cpu].cec_envs);
+                       cl_envs[cpu].cec_count++;
+                       read_unlock(&cl_envs[cpu].cec_guard);
                } else
                        cl_env_fini(cle);
+               put_cpu();
        }
 }
 EXPORT_SYMBOL(cl_env_put);
 
 /**
- * Declares a point of re-entrancy.
- *
- * \see cl_env_reexit()
- */
-void *cl_env_reenter(void)
-{
-        return cl_env_detach(NULL);
-}
-EXPORT_SYMBOL(cl_env_reenter);
-
-/**
- * Exits re-entrancy.
- */
-void cl_env_reexit(void *cookie)
-{
-        cl_env_detach(NULL);
-        cl_env_attach(cookie);
-}
-EXPORT_SYMBOL(cl_env_reexit);
-
-/**
- * Setup user-supplied \a env as a current environment. This is to be used to
- * guaranteed that environment exists even when cl_env_get() fails. It is up
- * to user to ensure proper concurrency control.
- *
- * \see cl_env_unplant()
- */
-void cl_env_implant(struct lu_env *env, __u16 *refcheck)
-{
-        struct cl_env *cle = cl_env_container(env);
-
-        LASSERT(cle->ce_ref > 0);
-
-        cl_env_attach(cle);
-        cl_env_get(refcheck);
-        CDEBUG(D_OTHER, "%d@%p\n", cle->ce_ref, cle);
-}
-EXPORT_SYMBOL(cl_env_implant);
-
-/**
- * Detach environment installed earlier by cl_env_implant().
- */
-void cl_env_unplant(struct lu_env *env, __u16 *refcheck)
-{
-        struct cl_env *cle = cl_env_container(env);
-
-        LASSERT(cle->ce_ref > 1);
-
-        CDEBUG(D_OTHER, "%d@%p\n", cle->ce_ref, cle);
-
-        cl_env_detach(cle);
-        cl_env_put(env, refcheck);
-}
-EXPORT_SYMBOL(cl_env_unplant);
-
-struct lu_env *cl_env_nested_get(struct cl_env_nest *nest)
-{
-        struct lu_env *env;
-
-        nest->cen_cookie = NULL;
-        env = cl_env_peek(&nest->cen_refcheck);
-        if (env != NULL) {
-                if (!cl_io_is_going(env))
-                        return env;
-                else {
-                        cl_env_put(env, &nest->cen_refcheck);
-                        nest->cen_cookie = cl_env_reenter();
-                }
-        }
-        env = cl_env_get(&nest->cen_refcheck);
-        if (IS_ERR(env)) {
-                cl_env_reexit(nest->cen_cookie);
-                return env;
-        }
-
-        LASSERT(!cl_io_is_going(env));
-        return env;
-}
-EXPORT_SYMBOL(cl_env_nested_get);
-
-void cl_env_nested_put(struct cl_env_nest *nest, struct lu_env *env)
-{
-        cl_env_put(env, &nest->cen_refcheck);
-        cl_env_reexit(nest->cen_cookie);
-}
-EXPORT_SYMBOL(cl_env_nested_put);
-
-/**
  * Converts struct cl_attr to struct ost_lvb.
  *
  * \see cl_lvb2attr
@@ -1153,6 +885,10 @@ static int cl_env_percpu_init(void)
        for_each_possible_cpu(i) {
                struct lu_env *env;
 
+               rwlock_init(&cl_envs[i].cec_guard);
+               INIT_LIST_HEAD(&cl_envs[i].cec_envs);
+               cl_envs[i].cec_count = 0;
+
                cle = &cl_env_percpu[i];
                env = &cle->ce_lu;
 
@@ -1219,7 +955,6 @@ void cl_env_percpu_put(struct lu_env *env)
        LASSERT(cle->ce_ref == 0);
 
        CL_ENV_DEC(busy);
-       cl_env_detach(cle);
        cle->ce_debug = NULL;
 
        put_cpu();
@@ -1233,7 +968,6 @@ struct lu_env *cl_env_percpu_get()
        cle = &cl_env_percpu[get_cpu()];
        cl_env_init0(cle, __builtin_return_address(0));
 
-       cl_env_attach(cle);
        return &cle->ce_lu;
 }
 EXPORT_SYMBOL(cl_env_percpu_get);
@@ -1298,51 +1032,19 @@ LU_KEY_INIT_FINI(cl0, struct cl_thread_info);
 static void *cl_key_init(const struct lu_context *ctx,
                          struct lu_context_key *key)
 {
-        struct cl_thread_info *info;
-
-        info = cl0_key_init(ctx, key);
-        if (!IS_ERR(info)) {
-               size_t i;
-
-                for (i = 0; i < ARRAY_SIZE(info->clt_counters); ++i)
-                        lu_ref_init(&info->clt_counters[i].ctc_locks_locked);
-        }
-        return info;
+       return cl0_key_init(ctx, key);
 }
 
 static void cl_key_fini(const struct lu_context *ctx,
                         struct lu_context_key *key, void *data)
 {
-       struct cl_thread_info *info;
-       size_t i;
-
-        info = data;
-        for (i = 0; i < ARRAY_SIZE(info->clt_counters); ++i)
-                lu_ref_fini(&info->clt_counters[i].ctc_locks_locked);
-        cl0_key_fini(ctx, key, data);
-}
-
-static void cl_key_exit(const struct lu_context *ctx,
-                        struct lu_context_key *key, void *data)
-{
-       struct cl_thread_info *info = data;
-       size_t i;
-
-        for (i = 0; i < ARRAY_SIZE(info->clt_counters); ++i) {
-                LASSERT(info->clt_counters[i].ctc_nr_held == 0);
-                LASSERT(info->clt_counters[i].ctc_nr_used == 0);
-                LASSERT(info->clt_counters[i].ctc_nr_locks_acquired == 0);
-                LASSERT(info->clt_counters[i].ctc_nr_locks_locked == 0);
-                lu_ref_fini(&info->clt_counters[i].ctc_locks_locked);
-                lu_ref_init(&info->clt_counters[i].ctc_locks_locked);
-        }
+       cl0_key_fini(ctx, key, data);
 }
 
 static struct lu_context_key cl_key = {
         .lct_tags = LCT_CL_THREAD,
         .lct_init = cl_key_init,
         .lct_fini = cl_key_fini,
-        .lct_exit = cl_key_exit
 };
 
 static struct lu_kmem_descr cl_object_caches[] = {
@@ -1366,35 +1068,33 @@ int cl_global_init(void)
 {
        int result;
 
-       INIT_LIST_HEAD(&cl_envs);
+       OBD_ALLOC(cl_envs, sizeof(*cl_envs) * num_possible_cpus());
+       if (cl_envs == NULL)
+               GOTO(out, result = -ENOMEM);
 
-       result = cl_env_store_init();
+       result = lu_kmem_init(cl_object_caches);
        if (result)
-               return result;
-
-        result = lu_kmem_init(cl_object_caches);
-        if (result)
-                goto out_store;
+               GOTO(out_envs, result);
 
-        LU_CONTEXT_KEY_INIT(&cl_key);
-        result = lu_context_key_register(&cl_key);
-        if (result)
-                goto out_kmem;
+       LU_CONTEXT_KEY_INIT(&cl_key);
+       result = lu_context_key_register(&cl_key);
+       if (result)
+               GOTO(out_kmem, result);
 
        result = cl_env_percpu_init();
-       if (result)
-               /* no cl_env_percpu_fini on error */
-               goto out_context;
+       if (result) /* no cl_env_percpu_fini on error */
+               GOTO(out_keys, result);
 
-        return 0;
+       return 0;
 
-out_context:
-        lu_context_key_degister(&cl_key);
+out_keys:
+       lu_context_key_degister(&cl_key);
 out_kmem:
-        lu_kmem_fini(cl_object_caches);
-out_store:
-        cl_env_store_fini();
-        return result;
+       lu_kmem_fini(cl_object_caches);
+out_envs:
+       OBD_FREE(cl_envs, sizeof(*cl_envs) * num_possible_cpus());
+out:
+       return result;
 }
 
 /**
@@ -1403,7 +1103,7 @@ out_store:
 void cl_global_fini(void)
 {
        cl_env_percpu_fini();
-        lu_context_key_degister(&cl_key);
-        lu_kmem_fini(cl_object_caches);
-        cl_env_store_fini();
+       lu_context_key_degister(&cl_key);
+       lu_kmem_fini(cl_object_caches);
+       OBD_FREE(cl_envs, sizeof(*cl_envs) * num_possible_cpus());
 }